タグ

ベイズ統計に関するshogo4405のブックマーク (5)

  • 教師なし単語分割の最前線。ベイズ meets 言語モデル - 武蔵野日記

    今日は daiti-m さんの教師なし単語分割話と id:nokuno さんの Social IME 話を聞きに行くため、仕事を午前中で終えて一路郷へ。第190回自然言語処理研究会(通称 NL 研、えぬえるけんと発音する)。六木から大江戸線で麻布十番、南北線に乗り換えて東大前で降りたのだが、ちょっと失敗して10分以上 Social IME の話を聞き逃してしまう。残念。 というわけで最初の発表については nokuno さん自身による発表スライドおよびshimpei-m くんのコメントを見てくれたほうがいいと思うが、個人的に思うのは(直接も言ったけど)研究発表とするならポイントを絞ったほうがいいんじゃないかなと。 研究の背景と目的 従来手法の問題点を指摘 それらを解決できる手法を提案(3つ) までは非常にいいのだが、そこから先がそのうちの1つしか説明・評価していないので、ちょっと述べてい

    教師なし単語分割の最前線。ベイズ meets 言語モデル - 武蔵野日記
  • グーグル、インテル、MSが注目するベイズ理論:スペシャルレポート - CNET Japan

    今日のコンピュータ界を動かす18世紀の確率論 今日のコンピュータ界をリードする権威ある数学者の1人であるThomas Bayes(トーマス・ベイズ)は、他の数学者と一線を画する。ベイズは神の存在を方程式で説明できると主張した人物だ。そんな彼の最も重要な論文を出版したのはベイズ人ではなく他人であり、また、彼は241年前に亡くなっている。 ところが、なんとこの18世紀の聖職者が提唱した確率理論が、アプリケーション開発の数学的基礎の主要な部分を占めるようになっているのだ。 上記数式はベイズの定理を示したものである。難解な記号の羅列に見えるかもしれないが、大雑把に言うと何かが起こる可能性はその事柄の過去の発生頻度を使ってほぼ推測ができるということだ。研究者はこの考え方を遺伝子研究から電子メールの選別にまで応用しようとしている。 ベイズ定理の数学的な詳細説明はミネソタ大学のウェブサイトに掲載されて

    グーグル、インテル、MSが注目するベイズ理論:スペシャルレポート - CNET Japan
  • Classifier4J - Classifier4J

    Classifier4J is a Java library designed to do text classification. It comes with an implementation of a Bayesian classifier, and now has some other features, including a text summary facility. I usually keep my blog updated with development progress and future directions. Classifier4J Version 0.6 Available (05 Feb 2005)Classifier4J 0.6 is available for download. See the news for further informatio

  • ベイジアンフィルタ - Wikipedia

    ベイジアンフィルタ (英: Bayesian filter, naive Bayes spam filtering) は単純ベイズ分類器を応用し、対象となるデータを解析・学習し分類する為のフィルタ。学習量が増えるとフィルタの分類精度が上昇するという特徴をもつ。個々の判定を間違えた場合には、ユーザが正しい内容に判定し直すことで再学習を行う[1]。 現状ではスパムメール(いわゆる迷惑メール)を振り分ける機能を持つソフトウェア(フィルタリングソフト)で、スパムフィルターでのスパム判定に利用されることが多い[1]。最近ではWeblogのトラックバック用フィルタ(トラックバックスパム対策)にも利用されるようになるなど、その利用範囲は徐々に広がりつつある。 概要[編集] ベイジアンフィルタでは、初期状態である程度までの振り分けができるように設定されている。振り分け対象となるデータ(迷惑メールなど)の学

    ベイジアンフィルタ - Wikipedia
  • 「日本語テキストを分類するベイジアンフィルタ」を簡単につくるyo - download_takeshi’s diary

    数週間前の話になりますが、「はてブのリニューアル会見」の記事を読んでいたところ、はてブにも「自動カテゴライズによる記事分類」の機能が搭載されるとか。。。 同じようなタイミングで「似たようなモノ」というか「ほぼ同じようなモノ」を作っていたので、すごーくインスパイアされてしまいました。ジュワ〜。(アドレナリンの放出音) 数週間たってもいまだ興奮冷めやらぬ状態なので、今日はその件について書いてみようと思います。 Lingua::JA::Categorize - a Naive Bayes Classifier for Japanese document. http://search.cpan.org/~miki/Lingua-JA-Categorize-0.00001/ 「はてブのパクリ」ではありません。「ベイジアンによる日語テキスト分類器」を「簡単に作る」ことを目的としたモジュールです。 も

    「日本語テキストを分類するベイジアンフィルタ」を簡単につくるyo - download_takeshi’s diary
  • 1