タグ

ベイジアンに関するyamadarのブックマーク (6)

  • 新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転 改

    新はてブ正式リリース記念ということで。もうリリースから何週間も経っちゃったけど。 新はてなブックマークではブックマークエントリをカテゴリへと自動で分類しているが、このカテゴリ分類に使われているアルゴリズムはComplement Naive Bayesらしい。今日はこのアルゴリズムについて紹介してみる。 Complement Naive Bayesは2003年のICMLでJ. Rennieらが提案した手法である。ICMLというのは、機械学習に関する(たぶん)最難関の学会で、採択率はここ数年は30%を切っている。2003は119/371で、32.1%の採択率だったようだ。 Complement Naive Bayesの位置づけは 実装が簡単 学習時間が短い 性能もそこそこよい という感じで、2003年段階にあっても、絶対的な性能ではSVMに負けていた。しかし、学習が早いというのは実アプリケーシ

    新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転 改
  • http://japan.internet.com/column/developer/20051005/27.html?rss

  • bsfilter プロジェクト日本語トップページ - OSDN

    語完全対応の学習型ベイジアン・スパム・フィルタ。 ファイル/パイプでのアクセス、POP proxyとして、IMAPサーバと接続して、と3種類の使用方法がある。 ruby scriptで実装。GPL。 ダウンロード 最新リリース bsfilter unnamed_release (日付: 2023-12-26) bsfilter 1.0.19 (for ruby 1.9 or 2.0) (日付: 2013-11-03) bsfilter 1.0.18.ruby1.9.rc5 (日付: 2013-03-10) bsfilter 1.0.18.ruby1.9.rc4 (日付: 2013-02-03) bsfilter 1.0.18.ruby1.9.rc3 (日付: 2013-01-14)

    bsfilter プロジェクト日本語トップページ - OSDN
    yamadar
    yamadar 2010/06/22
    参考にする。
  • ベイジアンフィルタ - Wikipedia

    ベイジアンフィルタ (英: Bayesian filter, naive Bayes spam filtering) は単純ベイズ分類器を応用し、対象となるデータを解析・学習し分類する為のフィルタ。学習量が増えるとフィルタの分類精度が上昇するという特徴をもつ。個々の判定を間違えた場合には、ユーザが正しい内容に判定し直すことで再学習を行う[1]。 現状ではスパムメール(いわゆる迷惑メール)を振り分ける機能を持つソフトウェア(フィルタリングソフト)で、スパムフィルターでのスパム判定に利用されることが多い[1]。最近ではWeblogのトラックバック用フィルタ(トラックバックスパム対策)にも利用されるようになるなど、その利用範囲は徐々に広がりつつある。 概要[編集] ベイジアンフィルタでは、初期状態である程度までの振り分けができるように設定されている。振り分け対象となるデータ(迷惑メールなど)の学

    ベイジアンフィルタ - Wikipedia
  • ベイズ確率 - Wikipedia

    ベイズ確率(ベイズかくりつ、英: Bayesian probability)とは、確率の概念を解釈したもので、ある現象の頻度や傾向の代わりに、確率を知識の状態[1]を表す合理的な期待値[2]、あるいは個人的な信念の定量化と解釈したものである[3]。 ベイズ確率の解釈は、命題論理を拡張したものであり、真偽が不明な命題を用いた推論を可能にするものと考えられる[4]。ベイズの考え方では仮説に確率を付与するが、頻度論的な推論では確率を付与せずに仮説を検証するのが一般的である。 ベイズ確率は証拠能力のある確率のカテゴリーに属する。仮説の確率を評価するために、ベイズ確率論者は事前確率を指定する。仮説の確率を評価するために、ベイズの確率論者は事前確率を指定し、新しい関連データ(証拠)に照らし合わせて事後確率に更新する[5]。ベイジアン解釈では、この計算を行うための標準的な手順と式が用意されている。 ベイ

  • Opinion:君はベイジアン・ネットワークを知っているか?(7/9) - @IT

    多摩川がタマちゃん騒動で盛り上がっていた2002年9月1日、「ベイジアンネットセミナーBN2002」という研究会が東京一ツ橋の学術総合センターで開かれていた。 ベイジアン・ネットワーク(Bayesian Network)とは、不確かな出来事の連鎖について、確率の相互作用を集計する手法で、知能情報システム構築の有力な手段になっている。「不確実性を扱うための計算モデル」として、認知科学(知能の仕組みや働きなどを解明する科学)、機械学習(経験や学習によって自身が進化するような機械システム)、データ・マイニング(膨大な量のデータの中から特徴や「意味」などを見つけ出す技術。マイニング【mining】とは山から資源などを掘り出す、採鉱/採掘という意味)、ロボティクス(ロボット工学)、ゲノム解析などに応用が広がっている。このセミナーは、産業総合技術研究所(元電子技術総合研究所、経済産業省傘下)が中心にな

  • 1