「深層学習で勝負するなら」で、深層学習でよい結果を出すには良質のデータを作るのが一番よいと述べました。とはいえ実際問題として、深層学習で必要とされるぐらいのデータ量を確保するにはそれなりのコストがかかるため、データ作りはなかなか手を出しにくいのも事実です。そこで本記事では、自分でデータを作ることにはよい学習結果を得る以上のご利益があることを説明したいと思います。 データを作るためには、(当然ですが)どういうデータが必要なのか明確にしないといけません。ある程度の量のデータを作るためには(クラウドソーシングなどを使って)多数の作業者に作成を委託することが普通ですが、そのためにはどういうデータをどう作って欲しいのか他人もわかるように説明できないといけません。仮にそれができないとすると、そもそも深層学習を使って何をしたいのかが怪しくなってきます。データを作る第一歩として何を作るのか説明することで、