关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者30人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普下令立即重启美国核试验 以应对其他国家核威胁

中安在线 浏览 41

纯电续航提升 新款小鹏X9纯电版申报图曝光

车质网 浏览 29

无方向盘设计 曝特斯拉Cybercab路试谍照

车质网 浏览 26

董宇辉一年到底能赚多少钱?

字母榜 浏览 98

以技术沉淀成就实力蝶变,欧菲光持续引领光学产业发展

时代周报 浏览 86

联想加速中东地区战略扩张 在沙特设立区域总部

网易科技报道 浏览 107

轻松!孙颖莎/王曼昱3-0金娜英/柳韩娜,晋级瑞典大满贯女双决赛

直播吧 浏览 72

岚图卢放:打破百年成见 重构豪华轿车价值标准

网易汽车 浏览 27

要重塑豪华电动SUV标杆 一汽奥迪Q6L e-tron上市

网易汽车 浏览 89

阿Sa闪婚原因曝光,曾冻卵计划40多岁生小孩

萌神木木 浏览 7

吹过的牛,奇瑞新能源兑现了

电动势 浏览 29

香港市民为山东舰竖大拇指:身为中国人值得自豪

看看新闻Knews 浏览 87

赵丽颖、黄晓明《小城大事》配角团“杀疯了”

肆季娱乐 浏览 33

【英超】揭幕战压轴大戏:曼联vs阿森纳

体坛周报 浏览 98

青艾文宿:酉州古城里的土家智慧居停

商界 浏览 86

良子的400斤大胃袋,装不下他的七宗罪

虎嗅APP 浏览 105

配华为乾崑ADS,岚图追光L官图发布

大象新闻 浏览 91

黄安称歌手千百惠病逝 她曾晒出大陆身份证

南方都市报 浏览 87

小米米家空气净化器连续十年中国线上销量第一,出货量破2500万

IT之家 浏览 32

沪媒:海港暂时压过申花一头 维塔尔状态越来越好成为“节拍器”

直播吧 浏览 88

中美AI竞争决胜于电力!

宋鸿兵 浏览 102
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12