关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者20人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

熊节:落实务实合作,全球南方亟需搭建多边平台|讲堂176-6⑤

文汇报 浏览 82

董璇二婚引关注!本地人都不在这办?

策略剖析 浏览 82

晚点独家丨千问 app,阿里要怎么做中国的 “ChatGPT”

晚点LatePost 浏览 38

美国务卿批准向中东国家出售价值258亿美元的武器

国际在线 浏览 4

陈道明主演!36集谍战剧来袭,是《沉默的荣耀》后我唯一想追的剧

娱乐圈笔娱君 浏览 876

命名Peaq 斯柯达全新纯电七座SUV今年发布

车质网 浏览 24

冬季穿衣不用太复杂!内搭选高领、外套选简约款,大方又耐看

静儿时尚达人 浏览 22

比变老更可怕的是不会穿!中年女人掌握4个技巧,优雅不费力

静儿时尚达人 浏览 26

564亿“新城系”接班进行时:女儿香港买壳、儿子出任A股董事长!

野马财经 浏览 101

谢娜主持晚会还是差一口气!直播接不上话,看热闹忘记控场一直笑

萌神木木 浏览 912

"世界第一美少年"去世 女儿未透露其具体死因

扬子晚报 浏览 53

外媒:驻有美军的伊拉克空军基地遭无人机袭击

环球网资讯 浏览 81

股市“捉妖”:穿透FOF资本迷局

最高人民检察院 浏览 87

比Genesis更显豪华 新款现代Grandeur最新消息曝光

乐选爱车 浏览 4

华为鸿蒙 HarmonyOS 6.0.0.107 SP7 / SP5 Developer 版本发布

IT之家 浏览 71

有人被拖欠工资!毫末智行北京总部人去楼空,员工抱着显示器离开;曝ASML为美国监控中国客户!官方否认;雷军斥资超1亿港元增持小米

雷峰网 浏览 29

媒体:日本拥有核武器 只差一把"螺丝刀"

北京日报客户端-长安街知事 浏览 23

售30.98万起 新款享界S9/S9T亮相广州车展

网易汽车 浏览 31

降入20万价格区间 曝廉价版特斯拉即将国产

车质网 浏览 73

深度解读“碱基编辑技术”:首个定制基因编辑疗法案例获成功

DeepTech深科技 浏览 31

美拉德失宠了?今年冬天最流行的3个颜色,谁穿谁好看!

LinkFashion 浏览 39
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12