by Nicole Honeywill 自然言語処理のアルゴリズムは言葉の順序や構造の理解を不得意としてきました。この課題を克服すべく、Googleが新たにデータセットを公開。このデータセットで訓練を行うと、機械学習モデルのテキスト分類精度が50%から80%にまで向上するとのことです。 Google AI Blog: Releasing PAWS and PAWS-X: Two New Datasets to Improve Natural Language Understanding Models https://ai.googleblog.com/2019/10/releasing-paws-and-paws-x-two-new.html Googleは機械翻訳や音声認識で自然言語処理を取り入れていますが、自然言語処理では最先端のアルゴリズムでも「ニューヨークからフロリダへのフライト」
![Googleが自然言語処理の弱点「言い換え」を克服するデータセットを公開](https://cdn-ak-scissors.b.st-hatena.com/image/square/95e101f14d9830a83d4ffc0d4e47677933353cc9/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2019%2F10%2F03%2Fpaws-x-dataset-google%2F00.jpg)