こんにちは。AIチームの杉山です。 今回は、音声合成/音声認識を用いたテキストのdata augmentationの可能性について検討したいと思います。 背景 近年、BERTに代表される深層学習の発展により、自然言語処理の分野は特定のタスクにおいて大きな発展を見せています。大量のテキストで事前学習したモデルを、タスクに合わせて追加のデータでfine tuningすることで良い成果を出しているのが特徴の1つですが、言い換えるとプロダクトで実用するにはそのタスク用の追加データを自分たちで作成する必要があります。データの作成は、アノテーションをクラウドソーシングするなど少しずつ安価で大量に行う仕組みもできつつありますが、作成にかかるコストや時間の面ではまだ課題があります。 そこで、画像分類などでよく行われるdata augmentationをテキストデータに対して適用し、データ数をかさ増しするこ