优优资讯

如今，像 GPT 系列这样的大模型已经展现出了惊人的通用能力，但要让它们在某个具体领域发挥最大效力，还需要进行“微调”（Fine-Tuning）。传统的“完整微调”方法，需要调整模型中全部的数百亿甚至千亿参数，这不仅需要海量的计算资源（比如数十上百块顶级 GPU），训练时间也十分漫长。因此，“参数高效微调”（PEFT，Parameter-Efficient Fine-Tuning）技术应运而生，它旨在只调整模型中极小一部分的参数，就能达到接近甚至超越完整微调的效果。

在 PEFT 家族中，LoRA 是一个里程碑式的工作。而研究团队关注到，业内最近提出的 DoRA（Weight-Decomposed Low-Rank Adaptation）在 LoRA 的基础上更进了一步。DoRA 的核心思想是，它认为模型权重的更新，可以被分解为“大小”（magnitude）和“方向”（direction）两个独立维度的变化。这个洞察非常深刻，因为它更贴近模型在完整微调时的真实动态。通过这种分解，DoRA 确实在很多任务上超越了 LoRA。

然而，在深入研究 DoRA 的过程中，研究团队发现它虽然方向走对了，但仍然存在一些问题。DoRA 在训练时，是同时优化大小和方向这两个部分的，并且用的是同一份训练数据。研究团队认为这种“耦合”的优化方式会带来两个关键问题：第一，它让模型的能力过于强大，很容易“死记硬背”训练数据，导致在面对新数据时表现不佳，也就是人们常说的“过拟合”。第二，大小和方向的同步更新会形成一种内在的牵制，限制了模型寻找最优解的学习能力。

所以，研究团队这次研究的核心目标非常明确：保留 DoRA 关于权重分解的深刻洞察，但

研究人员打造BiDoRA解决DoRA耦合，以高效微调解锁小数据潜力

唐一军16年...

跟惠利和Ja...

智己LS8官...

俄官员：俄美...

国乒男团3-...

蔡少芬回应张...

里程碑！刘铮生涯总抢断超越西热力江，升至CBA历史第13位

美国坠机航母将退役

中国生育率第一城！天门出生率反转，释放了什么信号？

AI周报|ChatGPT广告来了；台积电最新季度净利润创新高

从 Meta 拆解、苹果眼镜爆料，看「不科幻但好用」的 AR 眼镜｜硬哲学

马斯克摊上事了，旗下公司被多国调查封禁

卢浮宫一件被盗文物被发现已损毁疑为欧仁妮皇后皇冠

美媒称特朗普否决刺杀哈梅内伊计划

杨紫，值得一个肯定！

蔚来换电和理想5C，谁能硬刚，比亚迪兆瓦闪充？

解码基金“擒牛术”！从同花顺到新易盛，三波牛市验证三大选股核心逻辑

腾势Z9GT 3月5日开启预售单电机版本续航1036km

博主：据了解长春亚泰旧将王栋执教中乙长春喜都

女喜人也太难了，但也太棒了！

中方回应美100%关税威胁：动辄以高额关税进行威胁，不是与中方相处的正确之道

申京：我在休赛期专注练投篮和终结能力继续提升体能状态

前Meta工程师爆料：17人团队15个H-1B！一夜之间80%对手没了？

维多利亚现身前队友50岁派对儿子曾抨击家族不和

收评：沪指涨超1%逼近4000点两市放量超3600亿

“撒钱”撒出千亿市值公司，影石创新再次狂飙，已有7家公募抢筹

这一夜，龚俊不再吃香，被46岁的男配惊艳

伊朗最高领袖哈梅内伊遇害中方回应

汪峰森林北比小情侣还恩爱！当街搂在一起

杨颖带儿子逛香港中环，8岁小海绵很乖巧！