您的位置：首页 >理财 >

腾讯曝光新型AI攻击手法：“黑”掉神经网络，构造后门，最主流模型均不能幸免

来源：量子位时间：2020-08-20 14:38:40

原标题：腾讯曝光新型AI攻击手法：“黑”掉神经网络，构造后门，最主流模型均不能幸免来源：量子位

关注前沿科技

萧箫发自凹非寺
模型看起来运行效果不错，但潜藏危机。
一旦攻击者扣动“扳机”，或是你踩到了模型里埋下的“地雷”，整个AI模型就崩溃了。
想象一下，AI监控被干扰，盗贼可以登堂入室；通过几句噪音，家用AI音箱就能被外人操控……
最近，这种针对AI模型的新型“木马”攻击，已经被腾讯实现了。
腾讯的朱雀实验室成功模拟了3种攻击AI的新方法，从模型本身下手，在非常隐蔽的情况下将AI模型一一攻破。
无论是Tensorflow、Caffe还是Pytorch框架，目前最主流的AI模型无一幸免。
来看看它实现的原理。
将“木马”植入AI模型
传统的AI攻防技术，通常针对数据样本进行破坏。
例如，在图片样本中改造几个小元素，生成对抗样本，图中的熊猫就被识别成了长臂猿。
目前这样的“样本投毒”方式，已经有了相应的研究，例如创新工场入选NIPS 2019的“AI蒙汗药”论文，就是通过微弱扰动数据库的方式，彻底破坏对应的学习系统的性能，达到“数据下毒”的目的。
△ 周志华教授也在作者列
然而，如果攻击者直接控制AI模型的神经元，给AI植入木马，那么这样的攻击将会更加难防。
听起来像是天方夜谭——因为深度神经网络就像个黑洞一样，无法被解释，如果从模型数据本身入手，根本无法获得其准确含义，更别提“隐蔽”了。
就这，还想给AI模型植入“木马”？
但事实上，AI模型比想象中要“脆弱”。
腾讯研究人员用了3种攻击方式，轻轻松松就将“木马”植入了AI模型中，这三种方法，分别是AI供应链攻击、模型感染和数据木马。
利用AI框架「投毒」
AI供应链攻击，目的在于给部分AI模型植入恶意执行代码，让它变成大型“木马”。
然后，将这种木马投放到开源社区，就能让木马广泛地传播开来，造成大范围的AI供应链被污染。
这个攻击，靠的是各类软件相互的依赖性。
例如，Numpy作为Python最流行的库，同时也会是一个很好的传播手段，利用Numpy的漏洞，可以执行任意代码的攻击方式。
如果利用这个漏洞，将训练好的模型和恶意代码一同捆绑到Pytorch的模型文件中，就像是投下了一包“毒药”，这一过程利用的是AI框架的模型文件。
如下图所示，上下两张图分别是神经网络原始的部分模型、和被植入恶意代码的部分模型。
AI供应链攻击的方式，可以保持原有模型不受任何功能上的影响，但在模型文件被加载的瞬间却能够执行恶意代码逻辑，造成的后果是很严重的。
给“木马”开后门
在计算机程序中，“后门程序”通常是开发者为了修改方便，给程序里装的一个能逃过所有“安全检查”的程序，有点像“以管理员身份运行”。
然而，如果攻击者在使用AI模型时也“以管理员身份运行”，给AI模型埋藏一个“后门”，平时程序运行正常，然而一旦被激活，模型输出就会变成攻击者预先设置的目标。
这种攻击的危险之处在于，后门被触发前，模型的表现非常正常，所以平时可能无法发现这个病毒的存在。
此前，实现“后门攻击”的方式，是通过训练，影响模型的所有神经元信息达到的，但攻击链条太长。
腾讯的研究人员，通过直接控制神经元信息，改造出了一个后门模型。
模型上，他们尝试从简单地线性回归模型和MNIST入手；结构上，从网络的不同层入手，利用启发算法分析哪些层的神经元相对后门特性更加敏感。
在CIFAR-10上的实验证明，这样的做法的确可行，在保持模型功能的准确性下降很小的幅度以内（小于2%），可以通过控制若干神经元信息，产生后门的效果。
如下图，飞机被识别成了卡车；
甚至，连有着7种类型的马也被识别成了卡车……
在输出结果差异巨大的情况下，控制神经元相比于整个AI模型的功能来说，影响很小。
利用神经网络数据“藏毒”
此外，在大规模神经网络中，还有一种“木马”病毒的制造方式，那就是通过更改神经元的参数信息。
如何更改参数信息，但又不影响神经网络的功能实现？
研究发现，神经网络的参数信息，在小数点后3位之后，对检测准确性的影响微乎其微。
也就是说，如果攻击者将攻击代码编码到浮点数的后7、8位精度，那么就可以在小数点三位以后隐藏恶意信息。
如下图，9d 2d 57 3f == 0.84053415，替换成9d 2d 57 ff后，影响的精度就是 0.84053040～0.84054559，前四位都可以保持不变。
这样，就把一段恶意的代码“隐藏”到了大型神经网络中。
如果触发了设定的条件，恶意代码就会加载出攻击的效果。
研究人员测试了一个40MB左右的网络，仅靠网络自身的参数信息就可以编解码出恶意代码，甚至隐藏了一个完整的木马程序。
相对于如此多种攻击AI模型的“大招”，目前业内却还没有可用的“杀毒软件”，用于检测这种被攻击的情况。
AI“杀毒软件”亟待研发
腾讯的研究人员称，目前通过修改神经元的方式，达到近似模型后门的效果，属于国内首次实现。
这种攻击类型，如果配合传统的漏洞利用技术，那么只需要控制神经元就能让AI模型“中毒”。
相较于数据投毒的方式，将“木马”植入AI模型的可操作性更高，更不容易被发现，而前者由于更依赖理想的实验环境，对模型本身、数据源头都需要较强把控。
事实上，神经网络“木马”在硬件方向上已有相关技术研究，但如果硬件木马改成动态设计，将可能产生非常大的危害。
目前，领域内正在研究这方面的安全防御建设，力求在多方计算、共享模型的场景下，在研发阶段就提前考虑对模型文件的保护。
不必过于担忧
当然，研究人员也表示，这种“木马”植入，可以通过“模型可信加载”进行规避。
也就是说，在每次加载模型前，通过交叉对比、数据校验来规避木马，有助于将安全理念贯穿整个流程，也能推动AI行业的安全水平提升。
不过，这些安全理念，开发者自己也要了然于心，最起码，可以通过两个方向来进行预防。
首先，从第三方渠道下载的模型，即便没有算力资源进行重新训练，也要保证渠道的安全性，这样，才能避免直接加载不确定来源的模型文件。
其次，对模型文件加载使用也要做到心中有数。如果攻击者需要一部分代码的配合才能完成攻击，那么开发者是可以从代码检测中发现漏洞的。

返回融道中国首页 >>

　　版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“融道中国”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场。

延伸阅读

科创板上市受阻？一文解读吉利汽车问询重点与最新进展

投资研报【券商荐股精选】龙头股的“合理位置”与“安全边际”在哪里？周期股这一风险曝光【新能源汽车每日动见】上游资源价格涨跌分化...
2021-03-23
世卫组织：全球新冠肺炎确诊病例超过1.232亿例

原标题：世卫组织：全球新冠肺炎确诊病例超过1 232亿例根据世卫组织最新实时统计数据，截至欧洲中部时间3月23日9时46分（北京时间3月23
2021-03-23
环评师"4个月编千余份报告" 光明时评:对糊弄作假的环评要出重拳

来源：光明网时评频道如此环评操作，明显存在重大弄虚作假嫌疑，这不是在以科学严谨的态度在做环评，而是堕落成为环评的“批发商”和“...
2021-03-23
中国太平2020成绩单：净利同比降27%，财险、再保险亏损

原标题：中国太平2020成绩单：净利润65 49亿港元同比降27%，财险、再保险亏损3月23日，中国太平发布2020年业绩报告。全年，太平保
2021-03-23
电子烟监管将落地:龙头雾芯科技率先暴跌 A股电子烟板块全面下跌

投资研报【券商荐股精选】龙头股的“合理位置”与“安全边际”在哪里？周期股这一风险曝光【新能源汽车每日动见】上游资源价格涨跌分化...
2021-03-23
"交通强国"基建先行行业估值已"见底"、轨交领域或将率先起飞?

投资研报【券商荐股精选】龙头股的“合理位置”与“安全边际”在哪里？周期股这一风险曝光【新能源汽车每日动见】上游资源价格涨跌分化...
2021-03-23
北京银保监局：严肃查处个人经营性贷款违规流入房地产市场

原标题：北京银保监局严肃查处个人经营性贷款违规流入房地产市场来源：北京日报针对北京地区房价持续上涨和个人经营性贷款资金违规流入...
2021-03-23
我国金融网关“官宣” 跨境金融网络与信息服务水平进一步提升

新华社北京3月23日电题：我国金融网关“官宣”！跨境金融网络与信息服务水平进一步提升新华社记者吴雨随着金融业对外开放不断深化，我...
2021-03-23

最新文章

马斯克V.S薛其坤：立足当下对人类未来展开无限想象

马斯克V.S薛其坤：立足当下对人类未来展开无限想象

精彩推荐

图文观赏

众安在线扭亏为盈：2020年净利5.5亿数字生活生态驱动增长

众安在线扭亏为盈：2020年净利5.5亿数字生活生态驱动增长

热门推荐

友情链接：
百度地图融道中国山西商业网大军事网中国白银理财网科技金融网贵州热线万隆金银理财网百度地图大事中国中国啤酒网巴中房产网深圳都市网南方站长网

版权所有：融道中国