タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

ベイズ分類器に関するmfhamのブックマーク (2)

  • 【ベイズ】Naive Bayes(単純ベイズ)による文書分類のサンプルプログラム【Perl】

    【ベイズ】Naive Bayes(単純ベイズ)による文書分類のサンプルプログラム【Perl】 2013-07-26-1 [Programming][Algorithm][NLP] かなり昔に作った Naive Bayes(単純ベイズ)による文書分類のサンプルプログラムを整理したので公開しておきます。Perl で書かれています。Pure Perl。 Naive Bayes についての詳細は下記のサイトをどうぞ。 - 単純ベイズ - 機械学習の「朱鷺の杜Wiki」 - Wikipedia:単純ベイズ分類器 さて、Naive Bayes で分類するときには下記の式を用いるわけです。 Pについての定義は下記: 実装を簡単にするために log をとって足し算にしています(argmax ですが実際はマイナスかけて argmin で実装)。 学習データ 分類したいカテゴリごとに1行。 各行はカテゴリのラ

    【ベイズ】Naive Bayes(単純ベイズ)による文書分類のサンプルプログラム【Perl】
  • 20 Newsgroupsで分類精度を評価 - 人工知能に関する断創録

    ナイーブベイズを用いたテキスト分類(2010/6/13)の続きです。前回、実装したナイーブベイズの分類精度を評価してみます。テキスト分類のベンチマークとして使われるのは Reuters-21578 20 Newsgroups といったデータセットです。今回は、ナイーブベイズの分類精度を20 Newsgroupsで評価してみたいと思います。論文は散々読んだけど自分で試すのは初めてなんだよなー。 20 Newsgroups http://qwone.com/~jason/20Newsgroups/ Usenet*1から収集した約20000文書、20カテゴリのデータセットです。カテゴリは下の20個。まあ何となくどんなカテゴリなのかわかりますね。おおまかにcomp、rec、sci、talkに分けられるので4カテゴリとして扱うこともあるようです。 comp.graphics comp.os.ms-w

    20 Newsgroupsで分類精度を評価 - 人工知能に関する断創録
  • 1