关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技97人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

陈赫去国外度假,俩女儿一个像爸一个像妈

大嘴爱哔哔 浏览 30

王楚钦终于清白了!澄清恋爱谣言

詹妹侃体育 浏览 83

三句在低谷中给我力量的话

黎贝卡的异想世界 浏览 102

A股三家HPV疫苗公司业绩齐降,市场“蓝海”变“红海”,专家:需要降价争夺人群

红星资本局 浏览 92

圣米伦夺苏格兰联赛杯,进球队员赛后采访不慎爆粗后道歉

懂球帝 浏览 33

砍树?佩杜拉:马特塔与AC米兰渐行渐远了

懂球帝 浏览 28

居然智家新任“掌舵人”定了,53岁王宁当选董事长并兼任CEO

红星资本局 浏览 88

知名女演员突发声明!剧方道歉:已开除涉事人员

乡野小珥 浏览 34

西芒杜铁矿石准备装船,榨取中国钢企利益的时代该结束了

北向财经 浏览 34

瓜帅:利物浦和阿森纳都在争冠;英超风格的改变?我会接受

懂球帝 浏览 48

岛内学者:若赖清德无法降低两岸紧张 特朗普会不开心

海峡导报社 浏览 43

谢霆锋带大儿子迪拜度假 儿子颜值被评没爸爸帅

阿废冷眼观察所 浏览 82

天玑 9500 影像能力强势升级,vivo/OPPO 新旗舰影像体验令人期待

IT之家 浏览 101

固态电池颠覆集流体材料选择,镍基材料龙头“远航精密”能否寻得机遇?

时代周报 浏览 86

美媒称普京呼吁伊朗接受"零浓缩铀" 俄方批驳:假新闻

新京报 浏览 142

美军突袭细节披露 加拉加斯居民:大地在震动 太可怕了

齐鲁壹点 浏览 25

站在4000点的十字路口,这六位“固收+”强将值得一看

证券市场周刊 浏览 35

印乐"空降"少林寺1个月:去商业化 捐款二维码无法付款

时代周报 浏览 89

手感低迷但频造杀伤,利拉德12中2&罚球10中9取15分7板7助2断

懂球帝 浏览 298

年度最嚣张女配:只给自己磨皮,却被观众偏爱

Yuki女人故事 浏览 23

卢拉:不希望美国对委发动“地面入侵”

参考消息 浏览 32
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12