关闭广告

KAIST AI揭秘:让AI视频生成真正理解"谁对谁做了什么"的关键技术

科技行者23人阅读


当你看到一个AI生成的视频,画面中一个人正在递给另一个人一杯咖啡,你可能会觉得这很自然。但如果仔细观察,你会发现很多问题:咖啡杯可能突然消失了,递咖啡的人变成了两个人,或者咖啡杯莫名其妙地漂浮在空中。这些看似简单的交互场景,对AI来说却是极大的挑战。

来自韩国科学技术院(KAIST)AI实验室的研究团队,包括Siyoon Jin、Seongchan Kim、Dahyun Chung、Jaeho Lee、Hyunwook Choi、Jisu Nam、Jiyoung Kim和Seungryong Kim,在2025年10月发表了一项突破性研究。这项名为"MATRIX: Mask Track Alignment for Interaction-aware Video Generation"的研究,首次系统性地解决了AI视频生成中的交互理解问题。有兴趣深入了解的读者可以通过arXiv:2510.07310

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

90后“富二代”接棒零食帝国!1.5万家好想来年入323亿冲刺IPO

野马财经 浏览 76

俄乌战场惊现"丐帮打法" 俄无人机绑棍子捅落乌无人机

鲁中晨报 浏览 42

大金晒出对话录屏!许凯承认动手家暴

萌神木木 浏览 79

AR-HUD+800V 全新零跑C11售14.98万起

网易汽车 浏览 125

5C超充/乾崑ADS 4 深蓝S09超长续航超充版售价23.99万起

网易汽车 浏览 81

特斯拉撞树后打不开车门 5人被困燃烧的车内身亡

每日经济新闻 浏览 28

媒体:马杜罗大难临头仍相信"不至于" 但美却赶尽杀绝

文汇报 浏览 30

曾经爆火的潘多拉,为什么“卖不动”了?

国是直通车 浏览 83

美国纽约市长选举进入"最后冲刺":印度裔候选人领跑

红星新闻 浏览 33

从16万到45万,全都配上最强智驾!鸿蒙智行一口气连发7款车

Autolab 浏览 83

尖扎黄河特大桥施工人员:原计划8月底合龙 没想到出事

极目新闻 浏览 97

丰田新款Land Cruiser FJ最新消息曝光

乐选爱车 浏览 36

见证历史!深夜,全线爆发!

券商中国 浏览 68

谁在重塑中国财富格局?AI前十强企业合计价值超1.8万亿,暴涨207%

时代周报 浏览 21

国王记者:即使能把库明加送走 勇士也更倾向于蒙克而不是德罗赞

直播吧 浏览 82

何广智,太反人性

周一叨 浏览 85

金鸡奖名场面!第1排大佬坐镇,咏梅表情管理,袁弘第5次当锦鲤

娱乐圈笔娱君 浏览 139

张雨绮被抵制成功!辽视春晚已将她除名

萌神木木 浏览 20

比亚迪天神之眼A/B/C有何区别?一张图看懂

小号撩车 浏览 263

大金晒出对话录屏!许凯承认动手家暴,女方喊话他:你天黑了吗

萌神木木 浏览 66

柬埔寨提高获取公民身份投资门槛:至少需100万美元

红星新闻 浏览 15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12