INTRODUCTION 前回に引き続き、kaggleのTensorflow Speech Recognition Challangeの上位者の アプローチを紹介いたします。 これはこの記事の続きです。 先にそちらをご覧ください。 今回は Network Architecture optimizer resampling normalization / standarization data augmenation silenceクラスへの対応 未知のunknonwへの対応 軽量化・高速化の工夫 LBのデータのトレーニングへの利用 について触れます。 nerwork architecture CNNベースのものがほとんどで、DNN以外のアプローチはほぼ見られません。 2ndの人以外は画像に対しても利用されるオーソドックスなアーキテクチャーでした。 なお、以下はすべてアンサンブル前のレベル1

