タグ

ブックマーク / qiita.com/nazoking@github (1)

  • 【翻訳】scikit-learn 0.18 User Guide 4.2 特徴抽出 - Qiita

    sklearn.feature_extraction モジュールは、テキストや画像などのフォーマットからなるデータセットから機械学習アルゴリズムでサポートされている形式の特徴量を抽出するために使用できます。 注記 特徴量の抽出は、特徴量の選択とは大きく異なります。前者は、テキストやイメージなどの任意のデータを機械学習に使用できる数値特徴量に変換することです。後者は、これらの特徴値に適用される機械学習技術です。 4.2.1. dictsからの特徴量のロード クラスDictVectorizerは、標準のPython dictオブジェクトのリストとして表される特徴量配列を、scikit-learn推定器で使用されるNumPy / SciPy表現に変換するために使用できます。 特に処理が速いわけではありませんが、Pythonのdictには、使いやすく、疎である(存在しない特徴を格納する必要はありま

    【翻訳】scikit-learn 0.18 User Guide 4.2 特徴抽出 - Qiita
  • 1