タグ

ブックマーク / data-science.tokyo (1)

  • 特徴量エンジニアリング

    「データがあれば、 統計学 や 機械学習 で何かすごいことができる」、と思いたくなりますが、データとソフトだけではどうにもならないことは、よくあります。 文章のデータや画像のデータが、そのままではどうにもならないことは想像しやすいと思いますが、 表形式にまとまっていて、外れ値や欠損値 のない数字データだったとしても、うまく行くとは限りません。 生のデータを、 統計学 や 機械学習 で成果を出せるデータに変換する技術は、「特徴量エンジニアリング(Feature Engineering)」と呼ばれています。 表形式のデータを作るための特徴量エンジニアリング 音声、文章、画像などは、生のデータのままでは、機械学習で扱うことができません。 こうしたデータを表形式にまとまったデータにするための特徴量エンジニアリングは、 画像認識や音声認識技術として、研究されて来ています。 表形式のデータからの特

  • 1