关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者20人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从口袋PC到智能座舱:华为新品矩阵亮相2025中国移动全球合作伙伴大会 解码智慧生活

快科技 浏览 66

首席炒黄金期货大赚14亿?国海证券前固收首席靳毅辟谣称已报警

深蓝财经 浏览 40

盲打!快船和掘金比赛连续出现计时器故障,裁判被迫手动计时

懂球帝 浏览 80

亚马逊美股盘前涨幅扩大至5%

证券时报 浏览 30

绝味食品,被财务魔法打败了魔法

每日资本论 浏览 71

"柴怼怼"被逮捕:因"打假"走红后售假 有人消费近10万

澎湃新闻 浏览 63

Figure AI发布人形机器人通用大模型:能识别陌生物品,两台机器人可共享运行

澎湃新闻 浏览 277

清华字节跳动首创视频换脸新纪元:让照片主角完美融入视频场景

科技行者 浏览 26

21岁韩乒一姐状态下滑?混双+女单皆不敌33岁老将 韩媒:极易崩盘

颜小白的篮球梦 浏览 46

《生万物》大结局9人不幸离世,宁绣绣却活到了最后!

电和影 浏览 100

150万条聊天记录背后,人们都在用AI干什么?

澎湃新闻 浏览 89

突破LLM遗忘瓶颈,谷歌「嵌套学习」让AI像人脑一样持续进化

机器之心Pro 浏览 37

"最快女护士"哭求领导支持调休跑马引热议 账号已关评

极目新闻 浏览 95

齐沃:阿森纳和拜仁是目前欧洲最强,但这不意味着我们输定了

懂球帝 浏览 20

澳海滩枪击惊魂50分钟:枪手占据天桥向下扫射

澎湃新闻 浏览 27

OpenAI豪掷数万亿美元,打造全球最大AI基建帝国

IT之家 浏览 93

太狠了!奥特曼亲手「干掉」GPT-5.2,OpenAI祭出最强编程AI

新智元 浏览 19

票房破19亿!漫威退下来3位演员,联手拍R级片,给老东家上了一课

皮皮电影 浏览 91

粿粿、王子同游被指没边界感:会偷吃就是会偷吃

一池春水l 浏览 1212

德国总理首次访华时间被指敲定 高级经济代表团将跟随

澎湃新闻 浏览 18

Jane Street、Citadel Securities三季度业绩强劲,全年有望创纪录

华尔街见闻官方 浏览 23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12