关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro17人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

军报评何卫东、苗华等被开除党籍军籍:没有"铁帽子王"

北京日报客户端 浏览 49

“嘎子”谢孟伟被执行超1400万元 并被限制高消费

新京报 浏览 59

19.88万买原厂合规越野车 212 T01长风柴油版上市

网易汽车 浏览 21

新款比亚迪夏限时19.68万起售!上车天神之眼B激光版,支持城市NOA

车东西 浏览 30

"3女子带4孩续面"涉事双方均称遭到网暴 顾客最新发声

极目新闻 浏览 80

一辆小米SU7 Ultra飞坡10多米翻滚多圈!车主发文:感谢雷军,下辆还买!

扬子晚报 浏览 64

"给先生点烟"打卡照走红鲁迅夹烟墙画被投诉 馆方回应

上游新闻 浏览 86

豫览一周新车:极氪9X领衔,乐道L90/风云A9L/零跑

大象新闻 浏览 197

纯电续航达342km 比亚迪大唐申报图曝光

车质网 浏览 8

这是什么?瓜迪奥拉左脸颊有一块白色

直播吧 浏览 76

林俊杰被诊断出心脏病,44岁未婚无子

涵豆说娱 浏览 285

受贿8451万 中国农业银行原副行长楼文龙一审被判无期

央视新闻客户端 浏览 87

宇树180芭蕾机器人,究竟啥水平?

量子位 浏览 89

在普度寺,倾听BALMAIN八十年来的的呼吸

时尚COSMO 浏览 51

拉波尔塔:这场胜利来得正是时候;亚马尔一如既往地出色

懂球帝 浏览 23

“金字招牌”业绩几近腰斩,韩国免税业迎接“寒冬”

环球网资讯 浏览 9

限量555台 蔚来新ET5T暗影套装限定车型售31.6万

网易汽车 浏览 51

特朗普施压伊朗:美军舰队规模比在委内瑞拉的还大

大风新闻 浏览 18

深圳自动驾驶安全实验室揭牌成立,将重点攻坚十大方向

南方都市报 浏览 17

浙江绍兴3名保洁人员深夜死于地铁撞击:外包无社保

南风窗 浏览 3096

第二代腾势D9插混版亮相 搭载闪充技术

网易汽车 浏览 9
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12