NLPのコンペティションなどで、データの水増し(Data Augmentation)のために、逆翻訳をPythonでしたい時ありませんか? 例えば、Kaggleの「Toxic Comment Classification Challenge」では 1st place solution にこの手法が用いられていたりします。 https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge/discussion/52557 この記事では、Pythonで機械翻訳を用いて、簡単に逆翻訳をする方法について説明します。 機械翻訳による逆翻訳の例 引用: https://amitness.com/2020/05/data-augmentation-for-nlp/ 概要 googletrans を使えば、APIキーなど不要で、簡