关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro18人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日本船只非法进入我赤尾屿领海 中国海警驱离

界面新闻 浏览 79

携手华为!横琴基地每年将培养3000名“数智人才”

海外网 浏览 32

今年双11,搞出了点新意思

虎嗅APP 浏览 30

女孩引产遭拒生女婴被医生"送人" 抱养方称捡弃婴露馅

澎湃新闻 浏览 33

暴跌超60%!昔日热门基金,大瘦身!

券商中国 浏览 84

券商三季度660亿持仓出炉!香农芯创等35股持股市值超3亿元!

私募排排网 浏览 45

国家级5G智慧工厂背书,全新深蓝S07上市交付

经济观察报 浏览 75

“上半年强劲、下半年压制”!高盛总结英伟达股价规律,“年底前难以跑赢大盘”

华尔街见闻官方 浏览 83

别样七夕!老瓦晒出和马龙合影:乒乓球是属于我一生的浪漫

乒谈 浏览 87

泽连斯基称乌美代表团将于本周晚些时候举行会谈

国际在线 浏览 23

福建200亿国企董事长卸任,去年薪酬545万元

华美财经 浏览 61

记者:库迪西亚把埃塞基耶尔卖给药厂最高可盈利2000万美元

懂球帝 浏览 93

充电宝爆炸事件的受益者已经业绩翻番了

诗与星空 浏览 86

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家 浏览 79

年轻人,持续涌入股市!

券商中国 浏览 84

净利大增172.72%!这家券商半年报出炉,高管布阵也有新变化

券商中国 浏览 72

特朗普与普京会谈背后:俄方释放出寻求合作的信号

红星新闻 浏览 72

“阔腿裤”下岗了,今夏流行“瘦瘦裤”,120斤秒变90斤!

Yuki女人故事 浏览 87

宗氏家族争产案,一个细节让人反感

Yuki女人故事 浏览 90

字母哥首秀但他还走吗? 胜公牛并未让雄鹿宽心

仰卧撑FTUer 浏览 71

DO:布伦特福德拒绝了纽卡对维萨的4000万英镑最新报价

懂球帝 浏览 78
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12