关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者19人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美联储称美股估值偏高,美股会存在泡沫破裂的风险吗?

郭施亮 浏览 84

冬天穿衣尽量别露腿,这些基础穿搭可尝试,简单大方又不挑人

静儿时尚达人 浏览 12

小米YU7交付量突破4万台 推出高端定制服务

网易汽车 浏览 75

因凡蒂诺:对塞门约的种族歧视是绝对不可接受的

懂球帝 浏览 79

世纪大和解?奥尼尔现场观战霍华德:我没有讨厌你只是激励你!

直播吧 浏览 83

特朗普:已与普京就结束俄乌冲突方式基本达成共识

财联社 浏览 81

一颗卫星“掉链”,为何让全球航天界紧张?

上游新闻 浏览 22

力挺法老!紫菜蛋花兔发声了!

嘻笑堂 浏览 276

德约科维奇:想看到第三人挑战辛纳&阿卡,我曾扮演第三人的角色

直播吧 浏览 89

美国政府进入史上"停摆"最长时间 特朗普表态

红星新闻 浏览 32

马斯克将OpenAI苹果告上法庭:指控ChatGPT垄断iPhone,Grok被打压

机器之心Pro 浏览 89

比起辣妹风,早秋这样穿的女生才是高段位吧!

Yuki女人故事 浏览 79

股价跌超20%!东方甄选回应新东方CEO被立案调查:纯属谣言

红星资本局 浏览 74

标配15.6寸大屏+大空间 极狐T1预售6.88-9.38万

网易汽车 浏览 79

米尔纳:我看到若塔做过那个庆祝动作,我可能模仿得不太好

懂球帝 浏览 82

别问做不做大促,要问怎么把大促做深做透

蓝鲸新闻 浏览 67

外国投资者7月美债持仓再创新高,加拿大、中国、印度持仓下降

华尔街见闻官方 浏览 86

西班牙拒绝加入美国发起的“和平委员会”

国际在线 浏览 24

那不勒斯旧将克罗尔:那不勒斯有卫冕意甲实力,略微领先国米

懂球帝 浏览 20

何赛飞用肥皂卸妆 网友:张晚意找到“同皂中人”

台州交通广播 浏览 960

AI股现“冰火两重天”

国际金融报 浏览 83
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12