关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者37人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

波兰称考虑禁止中国电动汽车进入其军事基地 中方回应

财联社 浏览 33

农妇收玉米时遇山体坍塌失联4天 周边马路出现大坑

红星新闻 浏览 58

黄子韬婚礼险翻车!许艺洋喊错男朋友

林木体育解说 浏览 1028

中国人寿前三季归母净利润超1678亿元,高基数基础上同比增60.5%

证券市场周刊 浏览 49

伊朗民众:伊朗不会屈服于美国霸权

极目新闻 浏览 23

日产全新中大型SUV曝光!配激光雷达+800V平台,增程/纯电双动力

小史谈车 浏览 32

83亿港元“互持”,顺丰与极兔的双向奔赴能否实现1+1>2?

征探财经 浏览 21

张雨绮风波持续发酵,曝多个商务被取消

扒虾侃娱 浏览 27

中国信达“新帅”落定 宋卫刚出任总裁

21金融圈 浏览 29

《不眠日》大结局!墨远致是乌贼

丹妮观 浏览 89

AI时代,寻找超级创业者!徐汇区发布政策扶持一个人赛过一群人的“大牛”

上观新闻 浏览 22

1w的“臭脚鞋”,为啥这么多人抢着穿?真的辣眼睛!

Yuki女人故事 浏览 81

苏格兰11月世预赛大名单:麦克托米奈、罗伯逊领衔

懂球帝 浏览 37

印度尼帕病毒拉响警报,尚无疫苗和有效疗法,检测试剂盒受关注,多家上市公司回应

红星资本局 浏览 25

eSIM来了,但还在来的路上

北京商报 浏览 74

阿Sa闪婚原因曝光,曾冻卵计划40多岁生小孩

萌神木木 浏览 7

鸿蒙版《原神》预约炸场!帧率体验比安卓版还好?

雷科技 浏览 84

汪峰胡海泉等多名音乐人悼念他

话娱论影 浏览 94

推广中奖名单-更新至2025年10月25日推广

黎贝卡的异想世界 浏览 35

专家:佩通坦被解职遭严重打击 但她还有机会

第一财经资讯 浏览 91

2026款奥德赛杀疯了!IQS夺冠 + 配置换血,18万落地稳赚不赔

吴佩频道 浏览 81
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12