关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者20人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

汪小菲带娃国外度假,小玥儿穿搭简单干净

娱乐顺风车666 浏览 76

“上半年强劲、下半年压制”!高盛总结英伟达股价规律,“年底前难以跑赢大盘”

华尔街见闻官方 浏览 78

郑丽文当选提三大原则 称绝不让台湾成为"麻烦制造者"

海峡导报社 浏览 71

美媒列29岁的阿贾生涯荣誉:3次MVP&DPOY 2次总冠军&7次全明星

直播吧 浏览 76

姚晨曹郁发离婚声明 凌潇肃评论区沦陷

老吴教育课堂 浏览 20

何赛飞用肥皂卸妆 网友:张晚意找到“同皂中人”

台州交通广播 浏览 960

泽连斯基向特朗普展示俄境内潜在打击目标地图

环球网资讯 浏览 61

德媒:德总理拟动用俄央行在德冻结资产援乌

新华社 浏览 21

今年春天的裙子,裙摆越大越好看!

LinkFashion 浏览 16

90后新首富撒钱庆功 A股900亿巨头致歉

网易财经 浏览 73

多家房企称已不被要求上报三道红线 仍需提交资产负债率指标

财联社 浏览 20

住户睡觉没拔充电器家被烧 一两分钟火苗蹿到天花板

极目新闻 浏览 38

将提升极端场景识别度 小米汽车召回超11万台SU7标准版

网易汽车 浏览 76

整体进攻效率不高,卡登合计43中17&三分18中6砍49分

懂球帝 浏览 254

解读世纪华通半年报:季度营收九连增,核心增长模式获充分验证

证券市场周刊 浏览 74

邮报:利物浦等队密切关注塞门约,伯恩茅斯估价超7500万镑

懂球帝 浏览 51

纯电续航提升 新款小鹏X9纯电版申报图曝光

车质网 浏览 24

深度复盘:大疆是如何成为影像领域新巨头的?

极客公园 浏览 24

钱志敏突然当庭认罪震动旁听席 刑期或减免三分之一

封面新闻 浏览 34

DO:诺丁汉森林签马竞后卫加兰达协议,球员接受体检后将签约3年

直播吧 浏览 90

打造"一个吉利"航母 吉利汽车与极氪签订合并协议

网易汽车 浏览 92
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12