关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者56人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

董事会投票再现分歧!奥浦迈拟14.51亿元并购澎立生物再遭反对,独董陶化安多次质疑并购必要性

澎湃新闻 浏览 69

特斯拉2025年交付量跌逾8%至164万辆

澎湃新闻 浏览 23

詹姆斯:我一直以为科比的手势代表某种战术 后来发现是拿球单打

直播吧 浏览 69

前任自杀,现任小25岁,他算渣吗?

麻辣婊 浏览 43

在桃浦,解锁未来发展无限可能

上观新闻 浏览 22

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者 浏览 18

TA:布莱顿也有意乔-戈麦斯但时间不够,球员愿意留在利物浦

懂球帝 浏览 84

纯电CLA领衔,奔驰携28款车型亮相成都车展

观察者网 浏览 86

收评:创业板指高开高走涨2.29% 黄金概念股集体大涨

财联社 浏览 61

最高涨价28%,老铺黄金年内第三次调价,今年已累计涨约50%

红星资本局 浏览 43

印尼国脚小赖因德斯:这段旅程始于梦想,如今却以痛苦告终

懂球帝 浏览 64

今天,餐饮食材界的“拼多多”落户锡山!

环球网资讯 浏览 100

索尼 Inzone H9 II 游戏耳机曝光:3.5mm 接口兼容 Xbox

IT之家 浏览 84

梅州众将:不管未来怎样都要打好最后一场,拼出个保级机会

懂球帝 浏览 25

白百何声明翻车!晒对接聊天记录漏洞百出,工作室评论区沦陷

萌神木木 浏览 564

孙莉没想到,富养的女儿黄多多 给黄磊“争光”了

赵仔说 浏览 103

不先进也不安全,英伟达停产H20

观察者网 浏览 87

拉波尔塔:亚马尔未来会获金球 现场其他人喊登贝莱我们喊亚马尔

直播吧 浏览 79

夫妻欠债2.45亿移居海外被跨境追索 南京法院判了

扬子晚报 浏览 7

许家印出事前,只有他提前果断脱离恒大,至今毫发无损

壹只灰鸽子 浏览 56

苹果发布iPhone 17e

澎湃新闻 浏览 13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12