1. どんなもの? 自然言語処理に対する解釈可能な敵対的摂動を生成する sparse projected gradient descent (SPGD) を提案 2. 先行研究と比べてどこがすごいの? 自然言語処理における敵対的摂動の例 2 つのある単語埋め込み表現 (original embedding と neighbor embedding) 間における敵対的摂動の例 Original embedding から 3 ステップ (緑の矢印) 動いて、黄色で示された生の摂動 (raw perturbation)となる - スパース係数 の場合、最大ノルムの摂動の 50%が保持される Word A の摂動はコサイン類似度が最も高い最近傍に射影され、赤色で示された摂動 (projected perturbation) となる 先行研究に以下 3 つの問題点が存在する: Interpretab