演習4.6でW_sは出てくるんだけどW_Bが出てこない。
![2009-06-24 - 糞ネット弁慶](https://cdn-ak-scissors.b.st-hatena.com/image/square/84f12bb65ba637f74e5aad6dd13e9e776464f46e/height=288;version=1;width=512/https%3A%2F%2Fimages-fe.ssl-images-amazon.com%2Fimages%2FI%2F41z0AD06ZaL._SL160_.jpg)
パターン認識と機械学習 - ベイズ理論による統計的予測† This is a support page for the Japanese edition of "Pattern Recognition and Machine Learning" authored by C. M. Bishop. 本書は,Christopher M. Bishop 著「Pattern Recognition and Machine Learning」の日本語版です.上下2巻の構成です. パターン認識や機械学習の各種のアルゴリズムや背後の考えについて,ベイズ理論の観点から解説した教科書です. 基礎的な線形モデルから,カーネルトリック,グラフィカルモデル,MCMCなどの発展的な話題までをバランス良く収録しています. 数式による形式的な記述だけにとどまらず,豊富なカラーの図による直観的な説明もなされています. 本
ベイジアンフィルタとかベイズ理論とかを勉強するにあたって、最初はなんだかよくわからないと思うので、 そんな人にお勧めのサイトを書き残しておきます。 @IT スパム対策の基本技術解説(前編)綱引きに蛇口当てゲーム?!楽しく学ぶベイズフィルターの仕組み http://www.atmarkit.co.jp/fsecurity/special/107bayes/bayes01.html いくつかの絵でわかりやすく解説してあります。 自分がしるかぎり、最もわかりやすく親切に解説してる記事です。数学とかさっぱりわからない人はまずここから読み始めるといいでしょう。 茨城大学情報工学科の教授のページから http://jubilo.cis.ibaraki.ac.jp/~isemba/KAKURITU/221.pdf PDFですが、これもわかりやすくまとまってます。 初心者でも理解しやすいし例題がいくつかあ
昨日のNL190で以前より日記を拝見させていただいていた持橋さんの発表「ベイズ階層言語モデルによる教師なし形態素解析」がありました。辞書なしで文字単位のテキスト(コーパス)処理をして、情報理論的な基準で形態素解析(というか単語分割)を行うというもので、理論的にもよく考えられているようです。言語の文字列を階層Pitman-Yor過程による文字-単語階層nグラムモデルの出力とみなし, ベイズ学習を行うことで, 教師データや辞書を一切用いない形態素解析を可能にする。これにより, 教師データの存在しない古文や話し言葉,口語体などの形態素解析と言語モデルの作成が可能になる。発表は分かりやすく、結果はかな漢字変換にも応用が効きそうなもので、大変刺激を受けました。理論的な面については付け焼刃でなんとかなるようなものではなさそうなので、持橋さんのサイトで公開されている論文を読みながら勉強してみようと思いま
Papers 「潜在的正規分布によるイベントの時間関係の推定」. 船曳日佳里 (お茶の水女子大学), 持橋大地, 浅原正幸, 小林一郎. 言語処理学会第30回年次大会A5-5, 2024. (NLP2024 委員特別賞) 「語形の分布状況のベクトル化による言語地図の分類方法」. 近藤泰弘(青山学院大), 持橋大地, 言語処理学会第30回年次大会D5-1, 2024. 「木構造自己注意機構による教師なし統語構造解析」. 成田百花(お茶大), 持橋大地, 小林一郎(お茶大), 言語処理学会第30回年次大会D3-3, 2024. 「意味変化分析に向けた単語埋め込みの時系列パターン分析」. 木山朔, 相田太一(都立大), 小町守, 小木曽智信, 高村大也, 松井英俊, 持橋大地, 言語処理学会第30回年次大会E9-2, 2024. 「Hol-CCG構文解析と拡散モデルの統合による構文構造を陽に考慮
今日は daiti-m さんの教師なし単語分割話と id:nokuno さんの Social IME 話を聞きに行くため、仕事を午前中で終えて一路本郷へ。第190回自然言語処理研究会(通称 NL 研、えぬえるけんと発音する)。六本木から大江戸線で麻布十番、南北線に乗り換えて東大前で降りたのだが、ちょっと失敗して10分以上 Social IME の話を聞き逃してしまう。残念。 というわけで最初の発表については nokuno さん自身による発表スライドおよびshimpei-m くんのコメントを見てくれたほうがいいと思うが、個人的に思うのは(直接も言ったけど)研究発表とするならポイントを絞ったほうがいいんじゃないかなと。 研究の背景と目的 従来手法の問題点を指摘 それらを解決できる手法を提案(3つ) までは非常にいいのだが、そこから先がそのうちの1つしか説明・評価していないので、ちょっと述べてい
本家/.の記事より。 「ネット上の愚かな言論と戦う」ためのオープンソースソフトウェア開発プロジェクト、StupidFilterが立ち上がったそうだ(FastSiliconの記事)。開発者のGabriel Ortiz氏とPaul Starr氏曰く、 長い間我々は、「愚かな言論」の圧制を前に沈黙を強いられてきた。はじめインターネットは、同等の学識を持つ人々が知的な交流を行う場だった。しかしいわゆる「永遠の九月」以降、我々は新規参入者がもたらしたノイズの濁流に飲み込まれてしまった。ユーザドリブンなウェブコンテンツの出現は事態をいよいよ混沌とさせ、我々の忍耐も限界を越えた。逆襲の時が来たのだ。 と鼻息荒い。 ようするに、spam対策等で使われるベイジアンフィルタ等の技術を応用して、spamのみならず「荒らし」や下品な表現、オフトピックな言論、ネットイナゴの類の自動検出を目指しているようである。迷惑
ベイジアン (bayesian)、ベイズ (bayes)、ナイーブベイズ (naive bayes) ってなんですか? ベイジアン (bayesian)、ベイズ (bayes)、ナイーブベイズ (naive bayes) という言葉は、POPFile や類似のメールフィルターの議論においてよく使われます。これらはたいていの場合、数学の公式のことを言っています。 Thomas Bayes は 1700 年代に確率論を研究した人で、彼の業績は ベイズ統計(Bayesian Statistics)として知られています。そして、この方法は、最近メールフィルタリングの分野でよくとりあげられるようになってきました。それはグループの異なるメッセージを分類するのに非常によい成績を発揮するからです。 POPFile はベイズの定理を用いて、あるメールが work、personal、spam のどのバケツに分
総合演習(情報特別演習)では、自然言語処理を勉強しています。自然言語処理に興味はあったけど、何から手をつけてよいかわからなかったので、今年は、イロハを知ることを目的に勉強中。 とりあえずの成果として Text Classification with CEEK.JP NEWS を作ったので公開します。成果というよりは、途中経過ですな。 CEEK.JP NEWS の 2005年8月 の記事データを基に、テキストの分類を行います。対応しているカテゴリーは、社会、政治、国際、経済、電脳、スポーツ、エンターテイメントの7つです。 ニュース記事を基にしているので、ニュースの方が分類が上手くいくと思います。また、特定の新聞社に絞らずに、ニュース検索 CEEK.JP NEWS のカテゴリーデータで学習しているので、少々精度が悪いような気もしますが。 分類が困難なニュース記事を分類するために開発しています。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く