关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者36人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上海一小区外墙瓷砖从32楼落下 9辆车被砸得面目全非

极目新闻 浏览 83

快船今日首发中有4人34+岁,NBA近9年来首队

懂球帝 浏览 24

特斯拉三季度净利同比暴跌4成!马斯克透露五大关键进展,为天价薪酬拉票

车东西 浏览 59

仅10%援助卡车获准进入 加沙地带饥荒危机加剧

极目新闻 浏览 76

惠普暗影精灵11《英雄联盟》典藏版月底开售,海克斯金色线条装饰

IT之家 浏览 57

债市,大调整!

米筐投资 浏览 31

美国禁令反噬!中国断供培育钻石,半导体巨头:完了,要停产!

木禾投研 浏览 57

绍伊古访华争分夺秒1天往返 谈好后马上给普京复命

头条爆料007 浏览 37

被嘲“软饭男”28年,每天为妻磨咖啡,如今谢伟俊推轮椅看世界

娱乐白名单 浏览 88

“V领毛衣”今年秋天爆火!知识分子风、老钱风都少不了它

LinkFashion 浏览 79

媒体:中国该如何在军事部署上经营台湾 如今值得思考

新民周刊 浏览 26

4位劣迹艺人复出失败,演出被取消,全部遭到抵制

美食阿鳕 浏览 338

麦肯尼:没能拿下3分很遗憾;新教练带来了新的理念和活力

懂球帝 浏览 39

蒋欣直言自己没人追,却被刘涛意外说出理想型

小杨侃事 浏览 76

于东来周鸿祎秦英林王宁张红超,2025河南企业家影响了中国?

BT财经 浏览 26

美媒:以色列暗杀胡塞武装高级领导人失败

环球网资讯 浏览 91

男团奋勇剑指卫冕!王楚钦抢五过关 林诗栋完胜 梁靖崑完全觉醒

颜小白的篮球梦 浏览 8

频曝食安问题、高管IPO前套现1.3亿!鸣鸣很忙上市太急?

互联网那些事 浏览 20

致态 TiPlus 7100s 固态硬盘发布:长江存储新一代颗粒,659 元起

IT之家 浏览 45

UC圣地亚哥学者巧用树形搜索让AI画画训练快2.4倍

科技行者 浏览 36

自动驾驶行业变天了!英伟达下场,要做“Robotaxi的安卓”?

雷科技 浏览 49
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12