关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者21人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

股份行AIC扩容至三家

北京商报 浏览 26

帕多瓦诺:斯帕莱蒂已成功调整球队,下一步需缩小积分差距

懂球帝 浏览 27

早有预兆!浙江老板遭刑事强制,一个多月前已有小道消息

壹只灰鸽子 浏览 54

能把埃尔法打下神坛?智界V9申报图曝光 定价50万左右

网易汽车 浏览 21

抛光镀铬超级亮!PNY 40周年纪念版RTX 5090/5080规格确认

快科技 浏览 89

新一期U17国足集训名单出炉:浮嶋敏挂帅,邝兆镭、帅惟浩在列

懂球帝 浏览 26

赵文卓才是真·人间清醒吧

小光侃娱乐 浏览 79

自然奇趣志|大树也“社恐”:探秘“树冠羞避”现象

半岛晨报 浏览 5

巴平民被枪杀 特朗普扬言“冲进加沙铲除哈马斯”

参考消息 浏览 78

董路:我给宋凯提了1建议但没被采纳 邵佳一力劝安东尼奥放弃传控

风过乡 浏览 25

拉加德暗示欧央行不急行动:政策处于有利位置,未预设利率路径,任何选项都应考虑

华尔街见闻官方 浏览 35

古尔曼:苹果版“ChatGPT”内部测试中,暂无面向公众发布计划

IT之家 浏览 75

媒体:一天内两个危险举动 再度揭示了日本的危险性

环球网资讯 浏览 9

迈阿密决赛对手主帅:梅西是GOAT但我们也不差,苏牙过不了任何人

直播吧 浏览 103

中国色特别策划 | 故宫建筑与阙羽重光

时尚COSMO 浏览 35

张升民任国家中央军事委员会副主席

新华社客户端 浏览 58

次节觉醒,杨瀚森半场8中3得9分6板1助3帽3失误,正负值-3

懂球帝 浏览 31

墨西哥总统:骚乱平息 瓜达拉哈拉机场遭占领消息不实

都市快报橙柿互动 浏览 22

“反对标题党,绝不是反对把标题写得有吸引力”

深蓝财经 浏览 25

特斯拉申报Model Y长续航后驱版 又是一个走量款

网易汽车 浏览 71

上海海事局:长江口10日一大型船舶航行交通管制

中华人民共和国海事局 浏览 91
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12