关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者20人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

普京警告欧洲勿阻挠和谈:如果欧洲想打 我们准备好了

澎湃新闻 浏览 32

电动Jeep曝新国产计划:或使用猛士技术,首车在2027年上市

明镜pro 浏览 71

堂食正在“消失”?头部餐饮连夜撤走餐桌……

餐饮老板内参 浏览 96

转会捡漏?多特蒙德有意签下弗里克麾下天才

绿茵情报局 浏览 26

阿里宣布子公司分拆上市

上观新闻 浏览 88

今夏最火的6只包包,怎么搭都好看

LinkFashion 浏览 93

网友吐槽房门被巨量垃圾堵住 社区:两名老人捡回来的

潇湘晨报 浏览 84

鹰击19首披露 中国高超音速导弹彻底甩开美俄雄踞第一

文雅笔墨 浏览 76

华语乐坛,困在怀旧里

虎嗅APP 浏览 29

董璇自曝高云翔偷偷再婚,疑似澳洲事件结束半年后,她并不在意

温柔娱公子 浏览 85

林清轩IPO之路:爆款依赖、营销豪赌与国货高端梦

Daily每日财报 浏览 6872

美是不妥协的日常,是在艰难里选择不投降

LinkFashion 浏览 96

马斯克之问,问到了美国政治最敏感的地方

浏览 295

美国施压澳大利亚增加军费 中国驻澳大使撰文提醒

环球网资讯 浏览 88

50岁蒋勤勤这状态绝了!新西兰海边生图似神女

阿握聊事 浏览 35

智驾出事网暴车企?权威人士:不赖车企,司机还要被三重“追责”

小李车评李建红 浏览 84

苏州"越野跑大神"误食毒蘑菇去世 送医时全身发黑

扬子晚报 浏览 102

欧乌给美俄峰会提条件

环球网资讯 浏览 99

胡塞武装称击沉一艘赴以色列船只 画面公布

每日经济新闻 浏览 83

首款搭载英特尔 Panther Lake 处理器的工业主板曝光,TDP 达25W

IT之家 浏览 78

牛弹琴:印度耍流氓太不地道 难怪巴基斯坦要发飙

北京日报客户端 浏览 24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12