关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者83人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

墨西哥一市长怀抱幼子被当众枪杀 曾誓言根除贩毒集团

红星新闻 浏览 31

太阳报:英超对10月的多场比赛时间进行调整以方便转播

直播吧 浏览 66

秋冬发色天花板!5款显白温柔发色拿图给Tony,染完被夸到过年

Yuki女人故事 浏览 17

OpenAI豪掷数万亿美元,打造全球最大AI基建帝国

IT之家 浏览 93

2025年净利至少增超78%!减肥药价格战凶猛,甘李药业:相关产品未上市,价格策略待定

时代周报 浏览 16

致态 TiPlus 7100s 固态硬盘发布:长江存储新一代颗粒,659 元起

IT之家 浏览 40

“最帅升旗手”张自轩结婚了

说点事 浏览 24

爱泼斯坦死亡疑云再添关键爆料人 其身份被证实为狱警

扬子晚报 浏览 19

巴西发起最致命反毒行动:致121人死亡 头号头目逃脱

红星新闻 浏览 43

中航科工2025年上半年收入双位数增长

证券市场周刊 浏览 93

拒绝对涉案做出反省 内塔尼亚胡请求特赦遭强烈抗议

环球网资讯 浏览 24

车顶激光雷达,人眼如果被扫到,确定没事?

小李车评李建红 浏览 68

加冕荷兰射手王+助攻王!德佩:又一破纪录时刻,而且远未结束

懂球帝 浏览 59

嘎子哥名下4家公司均已注销

金融界 浏览 77

季后赛胜场数150+仅五位球员:詹姆斯 费舍尔 邓肯 霍里 贾巴尔

直播吧 浏览 70

瞄准下沉市场!理财公司“牵手”农商行

国际金融报 浏览 79

郭艾伦受伤3天后揪出伤害者!目前账号已沦陷

祝晓塬 浏览 294

城市低空经济产业竞争度排名公布:成都位列第二,两大指标领跑全国!

红星资本局 浏览 74

斯内德:穆里尼奥抨击费内巴切是很不明智的

懂球帝 浏览 79

6名中国男子日本滑雪被困获救 救援费为每人100万日元

极目新闻 浏览 19

新能源汽车保有量全球第一,上海加速推进绿色技术创新成果转化示范应用

上观新闻 浏览 83
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12