关闭广告

研究人员打造BiDoRA解决DoRA耦合,以高效微调解锁小数据潜力

DeepTech深科技89人阅读

如今,像 GPT 系列这样的大模型已经展现出了惊人的通用能力,但要让它们在某个具体领域发挥最大效力,还需要进行“微调”(Fine-Tuning)。传统的“完整微调”方法,需要调整模型中全部的数百亿甚至千亿参数,这不仅需要海量的计算资源(比如数十上百块顶级 GPU),训练时间也十分漫长。因此,“参数高效微调”(PEFT,Parameter-Efficient Fine-Tuning)技术应运而生,它旨在只调整模型中极小一部分的参数,就能达到接近甚至超越完整微调的效果。

在 PEFT 家族中,LoRA 是一个里程碑式的工作。而研究团队关注到,业内最近提出的 DoRA(Weight-Decomposed Low-Rank Adaptation)在 LoRA 的基础上更进了一步。DoRA 的核心思想是,它认为模型权重的更新,可以被分解为“大小”(magnitude)和“方向”(direction)两个独立维度的变化。这个洞察非常深刻,因为它更贴近模型在完整微调时的真实动态。通过这种分解,DoRA 确实在很多任务上超越了 LoRA。

然而,在深入研究 DoRA 的过程中,研究团队发现它虽然方向走对了,但仍然存在一些问题。DoRA 在训练时,是同时优化大小和方向这两个部分的,并且用的是同一份训练数据。研究团队认为这种“耦合”的优化方式会带来两个关键问题:第一,它让模型的能力过于强大,很容易“死记硬背”训练数据,导致在面对新数据时表现不佳,也就是人们常说的“过拟合”。第二,大小和方向的同步更新会形成一种内在的牵制,限制了模型寻找最优解的学习能力。

所以,研究团队这次研究的核心目标非常明确:保留 DoRA 关于权重分解的深刻洞察,但

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

46岁港星回应 因钟嘉欣失落视后辞任TVB高层一职

TVB剧评社 浏览 23

万科三季度净利润亏损160.69亿,深铁今年第十次“输血”

财视传播 浏览 50

8样暑期出行的必备好物!最便宜的只要个位数!

Yuki女人故事 浏览 83

女人不管多大都可以这样穿衣搭配,不花哨、不臃肿,优雅舒适

静儿时尚达人 浏览 19

许荔莎晒牵手画面反击于正!持续曝许凯出轨实锤,直言太寒心了

萌神木木 浏览 108

泽连斯基:已着手制定具体安保方案

每日经济新闻 浏览 82

长城汽车正式取消"大小周" 老员工泪目:盼了30年

大风新闻 浏览 19

AI 正在接管代码,AWS 首席布道师却说:开发者的未来在「沟通」

极客公园 浏览 53

平安MVP周慧琳:身披专业铠甲,坚守利他之心

经理人杂志 浏览 80

不忍了!「东极岛」这一刀,狠狠反杀

吐槽电影院 浏览 98

克6谈控球高手:库里&欧文&保罗&弗朗西斯&巴郎戴维斯&范埃克塞尔

直播吧 浏览 77

在闲鱼上搜索“男友不让穿”后,我震惊了

Yuki女人故事 浏览 75

套路百出,不如“癫剧”灵机一动

时尚COSMO 浏览 89

2岁女童家门口失踪10多天 在离家3公里山上石缝中离世

红星新闻 浏览 79

巴特勒18+10勇士轻取鹈鹕3连胜,库里9+5穆迪单节7三分比肩传奇

湖人崛起 浏览 24

韩磊发声!否认致人怀孕后失联,将起诉对方诽谤,罪名坐实要判刑

萌神木木 浏览 80

欧盟行业代表:中方出手反制欧盟 法国这一次受伤最重

澎湃新闻 浏览 22

迪丽热巴:从流量到实力,她还能走多远?

伊周潮流 浏览 18

微胖女孩冬天怎么穿衣?看看这27套冬季穿搭LOOK,保暖又显瘦

静儿时尚达人 浏览 19

小米新手表和手环曝光,REDMI K Pad2小平板电池有望大增

IT之家 浏览 21

发的朋友圈被认定"诽谤" 男子申请行政复议并申请国赔

红星新闻 浏览 92
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12