关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者17人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

克林顿与爱泼斯坦案受害者共浴照片披露:坐在浴缸里

扬子晚报 浏览 25

X把伊朗国旗改成狮子太阳旗 哈梅内伊把"国旗"删了

澎湃新闻 浏览 24

输球后被球迷辱骂,标准列日前锋:大街上也这么跟我说话试试

懂球帝 浏览 25

董宇辉出走后东方甄选营收跌了21亿元 俞敏洪发声

21世纪经济报道 浏览 77

新华社权威快报|我国生成式人工智能用户规模超5亿

新华社 浏览 59

特朗普称"不许中国领先美国" 不到24小时中方定下规矩

军机Talk 浏览 19

2026巴黎高定时装周|全世界最美的衣服都在这了

LinkFashion 浏览 28

天津一业主趁邻居不在 将一楼大堂全用砖砌上变自己家

潇湘晨报 浏览 79

净利润暴跌7912%!天域生物亏麻了

包不同 浏览 26

特朗普称印度将"购买委内瑞拉石油" 印度国内反应强烈

环球时报国际 浏览 20

夏天日常穿衣很简单!多用基础款、多穿收腰裙,显瘦又舒适

静儿时尚达人 浏览 80

内塔尼亚胡强势点名联大离场国家 3个地区被重点提及

文汇报 浏览 3376

油车首搭华为鸿蒙座舱!日产中国庆生40年,甩出三款新车,补全插混拼图

车东西 浏览 64

图片报:格雷罗恢复训练并有机会出战霍村,莱默尔尚未参加

懂球帝 浏览 18

OpenAI估值达5000亿美元;「原道」联手小岛秀夫,推《死亡搁浅》耳机;苹果手表将「大幅重新设计」

极客公园 浏览 92

周年庆专场|| 我的洗漱台上,真的不能没有它

黎贝卡的异想世界 浏览 81

宗馥莉辞职当天旗下公司宣布将使用"娃小宗" 原因披露

红星资本局 浏览 71

陈伟霆何穗官宣结婚生子,夫妻俩抱娃露面幸福满溢,二人隐藏好深

扒虾侃娱 浏览 1354

奇瑞汽车:风云 X3 系列采用全铝车身,未来深耕方盒子赛道

IT之家 浏览 79

机票“锁座”变相收费 10家航司被约谈

北京商报 浏览 29

利智和李连杰合影,一个合不拢嘴,一个一脸苦相

港剧叔 浏览 971
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12