关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者23人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

塔帅:赢球能带来能量和信心,我觉得这是足球最重要的两件事

懂球帝 浏览 30

记忆|慕津锋:追忆杨振宁先生

上观新闻 浏览 68

搭载双电机 极狐阿尔法S6四驱版或年内上市

车质网 浏览 22

伊朗记者:伊朗前主帅奎罗斯向富勒姆主帅席尔瓦推荐前锋塔雷米

直播吧 浏览 71

事关“人工智能+”,国务院出台重磅文件!重点在哪、如何布局?

国是直通车 浏览 78

农夫山泉的冰杯,比哈尔滨冰雪大世界的冰还赚钱?

BT财经 浏览 21

刘嘉玲在2.6亿豪宅办跨年宴,28岁侄子首露面

情感大头说说 浏览 26

49岁连饭都不会做,反被陆毅宠了28年

小张帅 浏览 83

零跑Lafa5:一副钢炮的皮,一颗家用的心?

Autolab 浏览 23

华之杰半年报透视:核心产品收入增长29%,全球化布局驱动稳健增长

时代周报 浏览 75

林依晨二胎喜讯背后:被造谣7年生吃青蛙的十年婚变史

Yuki女人故事 浏览 73

重量仅398g,vivo Vision探索版发布,12家授权店即将开启体验

网易科技报道 浏览 76

五十岁的女人,牢记这 “三不穿”,便能轻松平衡优雅与减龄

静儿时尚达人 浏览 88

湾区晚会近百万明星亮相!造型一个比一个认真,单依纯高定抢镜

萌神木木 浏览 85

科氪 | 荣耀MagicOS 10重构智能体验:AI成伙伴,全品牌互联破冰

36氪 浏览 42

E句话| 他们将补办婚礼?

仙女事件簿 浏览 1213

前英超裁判:桑德兰绝杀切尔西的进球因越位应被取消

懂球帝 浏览 54

曝保时捷正在重新设计718 EV跑车,“反向”适配燃油动力

IT之家 浏览 24

一票难求,“宇宙探索”小队今天整装再出发!

幕味儿 浏览 77

销量创近8年新高!半年卖出135万辆,长安汽车还差一个“爆款”?

时代周报 浏览 85

女人到了夏天要试试穿“红色”!高级明艳,大方又不失回头率

静儿时尚达人 浏览 141
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12