zoukankan      html  css  js  c++  java
  • 论文阅读 | TextBugger: Generating Adversarial Text Against Real-world Applications

    NDSS

    https://arxiv.org/abs/1812.05271

    摘要中的创新点确实是对抗攻击中值得考虑的点:

    1. effective

    2. evasive    recognized by human readers

    3. efficient

    在IMDB数据集上取得100%的成功率。

    最后有讨论可能的防御机制,可以重点看下能不能做这相关的工作。

    TEXTBUGGER:

    白盒:通过雅可比矩阵找到最重要的单词。

    https://jingyan.baidu.com/article/cb5d6105c661bc005c2fe024.html (梯度vs Jacobian矩阵vs Hessian矩阵)

      (和梯度的方法差不多)

    2-5步:计算重要性,对单词排序。

    6-14步:生成bugs:考虑视觉和语义的相似性;考虑character-level & word-level

    character-level:看起来就像是简单的拼写错误。目的:把未知词汇映射到未知embedding

    word-level:最近邻搜索。

    作者发现在一些词嵌入模型中(如word2vec),“worst”和“better”等语义相反的词在文本中具有高度的句法相似性,因此“better”被认为是“worst”的最近邻。

    以上显然是不合理的,很容易被人察觉。

    因此,作者使用了语义保留技术,即,将该单词替换为上下文感知的单词向量空间中的topk近邻。使用斯坦福提供的预先训练好的GloVe模型[30]进行单词嵌入,并设置topk = 5。可以保证邻居在语义上与原来的邻居相似。

     

    根据以往的研究,文本的意义很可能是由读者保留或推断后,几个字符的变化[31]。同时,在语义和句法上相似的词语代替词语,可以保证样本的相似性[1]。

    TEXTBUGGER的五种错误生成方法:(1)插入:插入一个空格到单词中。(2)删除:删除除第一个字符和最后一个字符外的任意字符。(3)交换:在单词中随机交换两个相邻的字母,但不改变第一个或最后一个字母。(4) Substitute-C (Sub-C):用视觉上相似的字符(例如,用“0”代替“o”,用“1”代替“1”,用“@”代替“a”)或键盘上相邻的字符(例如,用“n”代替“m”)代替字符。(5)Sub-W:在上下文感知的词向量空间中,用它的最近邻替换一个词。

    例子:

    基于视觉的替换的防御是不是可以考虑文本的visual embedding

    如算法2所示,在生成5个bug后,根据置信度的变化选择bug(选变化最大的)。用最优的bug来替换这个单词,得到一个新的文本e’(第8行)。我们重复上述步骤来替换下一个单词,直到找到解决方案(攻击成功),或者未能找到一个保留语义的对抗样本。

    黑盒:先找最重要的句子,然后通过打分函数找到最重要的单词。

    三个步骤:(1)找到重要的句子。(2)根据分类结果,使用评分函数来确定每个单词的重要性,并根据得分对单词进行排序。(3)使用bug选择算法改变选择的单词。算法3给出了黑箱对抗文本生成算法。

     

    2-6:找重要的句子。找到对最终预测结果贡献最大的重要句子,对其进行优先操作。

    使用spaCy库将每个文档分割成句子,然后过滤出具有不同预测标签的句子。即过滤掉Fl(si)不等于y的。然后根据重要性评分排序。句子si的重要性得分用预测的类Fy的置信度值表示。(选出最可能得到分类y的句子)

    8-11:找重要的词。首先要找到对原始预测结果贡献最大的最重要的词,然后通过控制语义相似度对其稍作修改。

    评分函数:(删除该词后置信度的变化,变化越高越重要)

    12-20:生成bugs。和白盒方法类似。

  • 相关阅读:
    mysql常用基本命令
    mysql8.0.13下载与安装图文教程
    k8s ingress 增加跨域配置
    Jenkins 备份恢复插件 thinBackup 使用
    k8s HA master 节点宕机修复
    nginx 跨域问题解决
    mongodb 3.4.24 主从复制
    k8s 线上安装 jenkins并结合 jenkinsfile 实现 helm 自动化部署
    k8s helm 运用与自建helm仓库chartmuseum
    centos6 源码安装 unzip
  • 原文地址:https://www.cnblogs.com/shona/p/11809257.html
Copyright © 2011-2022 走看看