优优资讯

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

《生万物》宁...

跟董明珠掐架...

神扑+关键扑...

领益智造新能...

刘强东“10...

豆包未成年人...

汇源内斗白热化：工会与股东会“对垒”，国中水务9.3亿怎么办？

楊千嬅开live老公乱入因一事说离婚

网约车司机询问乘客性经历被永久封号三年后起诉平台

陈赫去国外度假，俩女儿一个像爸一个像妈

王楚钦终于清白了！澄清恋爱谣言

三句在低谷中给我力量的话

A股三家HPV疫苗公司业绩齐降，市场“蓝海”变“红海”，专家：需要降价争夺人群

圣米伦夺苏格兰联赛杯，进球队员赛后采访不慎爆粗后道歉

砍树？佩杜拉：马特塔与AC米兰渐行渐远了

居然智家新任“掌舵人”定了，53岁王宁当选董事长并兼任CEO

知名女演员突发声明！剧方道歉：已开除涉事人员

西芒杜铁矿石准备装船，榨取中国钢企利益的时代该结束了

瓜帅：利物浦和阿森纳都在争冠；英超风格的改变？我会接受

岛内学者:若赖清德无法降低两岸紧张特朗普会不开心

谢霆锋带大儿子迪拜度假儿子颜值被评没爸爸帅

天玑 9500 影像能力强势升级，vivo/OPPO 新旗舰影像体验令人期待

固态电池颠覆集流体材料选择，镍基材料龙头“远航精密”能否寻得机遇？

美媒称普京呼吁伊朗接受＂零浓缩铀＂俄方批驳：假新闻

美军突袭细节披露加拉加斯居民：大地在震动太可怕了

站在4000点的十字路口，这六位“固收+”强将值得一看

印乐＂空降＂少林寺1个月:去商业化捐款二维码无法付款

手感低迷但频造杀伤，利拉德12中2&罚球10中9取15分7板7助2断

年度最嚣张女配：只给自己磨皮，却被观众偏爱

卢拉：不希望美国对委发动“地面入侵”