关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者30人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小米穿越风暴这一年,给创新者以时间

中国企业家杂志 浏览 22

0-6惨败后内马尔痛哭!儿子安慰内马尔:抬起头来,勇敢面对挑战

直播吧 浏览 80

“装了周杰伦”的机器狗?巨星传奇把6000台卖给了谁?

野马财经 浏览 24

30岁孟子义再破天花板 她让整个内娱都“沉默了”

老吴教育课堂 浏览 101

埃迪-豪联赛对前东家伯恩茅斯7场不胜,并列英超最长纪录

懂球帝 浏览 103

杜海涛用P图回应秃头:我有很多头发,不接受反驳

极目新闻 浏览 69

燕翔:A股上市公司ROE与相对估值分布变化

首席经济学家论坛 浏览 88

东风奕派汪俊君:用大数据为产品、营销、服务赋能

网易汽车 浏览 61

英超旧将:只要梅西还在就别去迈阿密,那里简直是灾难管理一团糟

直播吧 浏览 77

富士康被指再次从印度召回数百名大陆员工

环球时报国际 浏览 87

包钢板材厂爆炸工人被气浪掀飞 一铁球飞射砸塌二层楼

上游新闻 浏览 22

林允儿回应新剧争议,语带挑衅惹众怒,曝与韩方合作将全面收紧

扒虾侃娱 浏览 95

过去10年得分榜:字母哥力压哈登第一 德罗赞第三 詹五库六

直播吧 浏览 75

升级华为ADS 4/首发车内外对讲 新款智界R7售24.98万起

网易汽车 浏览 81

尴尬的是最后输了,狄龙回喷骂自己垃圾的热火球迷:看看比分,f**k

懂球帝 浏览 24

孤本奉献,世界音像遗产日今日特别放送!❤️

幕味儿 浏览 728

何穗首晒产后美照!身材苗条丰满,被质疑传递焦虑,本人连忙删图

萌神木木 浏览 179

武汉理工毕业生称因当保安遭学校约谈 本人否认蹭流量

封面新闻 浏览 15

特朗普援乌 或首次动用 “总统特别拨款权”

澎湃新闻 浏览 86

乌方呼吁美国对卡德罗夫"采取某种行动" 卡德罗夫发声

环球网资讯 浏览 22

开拓者队记:杨瀚森场均出场将超12分钟 首秀战戈贝尔是一大考验

罗说NBA 浏览 81
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12