关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者88人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

王思聪带懒懒看演唱会,舞台前对美女猛拍照

鑫鑫说说 浏览 56

阿里前主席张勇,花5354万港元买了套香港半山豪宅

财通社 浏览 46

比亚迪双旗舰谍照来了!大汉/大唐,更大、更强

车市红点 浏览 21

伊姐周六热推:电视剧《亦舞之城》;电视剧《时差一万公里》......

伊周潮流 浏览 27

精读季报丨谢治宇的基金,为什么只适合“买”,不适合“抄”?

一地基毛 浏览 20

专访长城汽车魏建军:只有高质量的流量才有价值,接受负面网络评论

红星资本局 浏览 80

50岁女人穿衣,记得色不过三、衣不紧身,照着穿想不气质都难

静儿时尚达人 浏览 38

《以法之名》里率先出圈的竟然是她

时尚COSMO 浏览 82

唯一参展的中国品牌,为何能在东京车展被“挤爆”?

道哥说车 浏览 43

针织+半裙,秋天最经典搭配,好看又减龄!

LinkFashion 浏览 87

中银基金核心基金经理频繁流失,投研能力受考验,改革已迫在眉睫

中访网 浏览 3155

美报告罕见承认中国电子战有优势

北京日报 浏览 23

国产大飞机首次落地温州,国航 C919 开始执飞北京-温州航班

IT之家 浏览 337

俄称已控制库皮扬斯克 正清缴乌军

每日经济新闻 浏览 25

上海业主十一出游后推开家门懵了 精装房成"化粪池"

环球网资讯 浏览 85

北京顶豪法拍逆袭:有亿元级毛坯别墅遭10位富豪疯抢

每日经济新闻 浏览 70

湖南省属最大国企再次增持长沙银行

湘财Plus 浏览 8

克林顿夫妇作证时间确认 民主党人炸锅:特朗普你等着

澎湃新闻 浏览 29

美联储,重磅来袭!降息传出大消息

券商中国 浏览 94

都体:在战平维罗纳赛后加练中,布雷默因为过度疲劳突然倒地

懂球帝 浏览 86

纯电续航可达700km AMG GLC 53 EQ谍照曝光

车质网 浏览 52
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12