タグ

kNNに関するgremorのブックマーク (1)

  • IIR chap 14: ベクトル空間分類 - Qiita

    Introduction to Information Retrieval の14章輪読用 Gunosy研究会 #31 の資料です Introduction ナイーブベイズでは用語を用語列か2値ベクトルで表現した 章ではベクトル空間モデルを用いて文書を表現し,テキストを分類する. 基的な考え方 ベクトル空間モデルでは各用語に対して1つの実数値の要素をもつベクトルとして各文書を表現する 通常TF-IDFを用いる R^|V| のベクトルとして表現される ベクトル空間分類は連続性仮説(contiguity hypothesis)の元に成り立つ 同じクラスの文書は連続した領域を形成し,他のクラスの領域とは重なり合わない. 連続領域に写像されるかどうかは文書の表現方法による 重み付け・ストップワードなど ex: "グループによって書かれた文書"と"個人によって書かれた文書"を区別したいケース 一

    IIR chap 14: ベクトル空間分類 - Qiita
  • 1