关闭广告

研究人员打造BiDoRA解决DoRA耦合,以高效微调解锁小数据潜力

DeepTech深科技98人阅读

如今,像 GPT 系列这样的大模型已经展现出了惊人的通用能力,但要让它们在某个具体领域发挥最大效力,还需要进行“微调”(Fine-Tuning)。传统的“完整微调”方法,需要调整模型中全部的数百亿甚至千亿参数,这不仅需要海量的计算资源(比如数十上百块顶级 GPU),训练时间也十分漫长。因此,“参数高效微调”(PEFT,Parameter-Efficient Fine-Tuning)技术应运而生,它旨在只调整模型中极小一部分的参数,就能达到接近甚至超越完整微调的效果。

在 PEFT 家族中,LoRA 是一个里程碑式的工作。而研究团队关注到,业内最近提出的 DoRA(Weight-Decomposed Low-Rank Adaptation)在 LoRA 的基础上更进了一步。DoRA 的核心思想是,它认为模型权重的更新,可以被分解为“大小”(magnitude)和“方向”(direction)两个独立维度的变化。这个洞察非常深刻,因为它更贴近模型在完整微调时的真实动态。通过这种分解,DoRA 确实在很多任务上超越了 LoRA。

然而,在深入研究 DoRA 的过程中,研究团队发现它虽然方向走对了,但仍然存在一些问题。DoRA 在训练时,是同时优化大小和方向这两个部分的,并且用的是同一份训练数据。研究团队认为这种“耦合”的优化方式会带来两个关键问题:第一,它让模型的能力过于强大,很容易“死记硬背”训练数据,导致在面对新数据时表现不佳,也就是人们常说的“过拟合”。第二,大小和方向的同步更新会形成一种内在的牵制,限制了模型寻找最优解的学习能力。

所以,研究团队这次研究的核心目标非常明确:保留 DoRA 关于权重分解的深刻洞察,但

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI周报|ChatGPT广告来了;台积电最新季度净利润创新高

第一财经资讯 浏览 27

从 Meta 拆解、苹果眼镜爆料,看「不科幻但好用」的 AR 眼镜|硬哲学

爱范儿 浏览 65

马斯克摊上事了,旗下公司被多国调查封禁

21世纪经济报道 浏览 33

卢浮宫一件被盗文物被发现已损毁 疑为欧仁妮皇后皇冠

极目新闻 浏览 48

美媒称特朗普否决刺杀哈梅内伊计划

财联社 浏览 86

杨紫,值得一个肯定!

星寒新影视 浏览 28

蔚来换电和理想5C,谁能硬刚,比亚迪兆瓦闪充?

路咖汽车 浏览 22

解码基金“擒牛术”!从同花顺到新易盛,三波牛市验证三大选股核心逻辑

券商中国 浏览 26

腾势Z9GT 3月5日开启预售 单电机版本续航1036km

网易汽车 浏览 20

博主:据了解长春亚泰旧将王栋执教中乙长春喜都

懂球帝 浏览 27

女喜人也太难了,但也太棒了!

时尚COSMO 浏览 24

中方回应美100%关税威胁:动辄以高额关税进行威胁,不是与中方相处的正确之道

环球网资讯 浏览 74

申京:我在休赛期专注练投篮和终结能力 继续提升体能状态

直播吧 浏览 66

前Meta工程师爆料:17人团队15个H-1B!一夜之间80%对手没了?

新智元 浏览 95

维多利亚现身前队友50岁派对 儿子曾抨击家族不和

少年仍需努力 浏览 28

收评:沪指涨超1%逼近4000点 两市放量超3600亿

财联社 浏览 50

“撒钱”撒出千亿市值公司,影石创新再次狂飙,已有7家公募抢筹

YOUNG财经 浏览 90

这一夜,龚俊不再吃香,被46岁的男配惊艳

温柔娱公子 浏览 991

伊朗最高领袖哈梅内伊遇害 中方回应

财联社 浏览 25

汪峰森林北比小情侣还恩爱!当街搂在一起

老吴教育课堂 浏览 86

杨颖带儿子逛香港中环,8岁小海绵很乖巧!

刘蕳爱下厨 浏览 94
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12