機械学習 はじめよう 第2回 確率の初歩 2010年7月13日 中谷秀洋 機械学習, 確率, 自然言語処理, ベイジアンフィルタ プログラム, アプリケーション, 機械学習, 事後確率, パラメータ, 確率変数 1 2 3 4 今回は,機械学習で使う「確率」のお話です。 確率は,統... 続きを読む
(アルファベットのみの言語は、カナ表記が未確認・未確定) カナ名未確定 - 参考文献 - 関連項目 - 外部リンク [編集] あ行 [編集] あ アイスランド語 - Icelandic - Wiki: is アイヌ語 - Ainu アイマク語(バルバリ語) - Aimaq (Barbari) アイマラ語 - Aymar... 続きを読む
■ 「あたし状態遷移図」、あるいは「あたし約5.2MB」 02:09 プロローグ 第1章 fullsize f:id:debedebe:20081217232147g 第4章 fullsize f:id:debedebe:20081218004151g 最終章 fullsize f:id:debedebe:20081218004952g grlsbl2008/12/18 11:53このマップ、なん... 続きを読む
Algorithm::Diff で類似文字列検索 2008-04-22-3 [Algorithm][Programming] Perl のモジュール Algorithm::Diff[2004-12-12-2]を使って、 線形時間で類似文字列検索するサンプルプログラム。 まあ、 agrep があればそれでいいんですけどね。 サンプルコード(ads... 続きを読む
第80回知識ベースシステム研究会を開催したが,二日間で58名の方々に参加して頂き,積極的に議論に加わって頂いた.この場を借りて,参加してくれた方々に感謝したい.大変遅くなった(爆)が,Googleの工藤拓氏による招待講演「大規模テキスト処理を支える形態... 続きを読む
IWSLT 2008 (International Workshop on Spoken Language Translation) (2008/10/20-21, Hawai'i, USA) AMTA 2008 (The 8th Biennial Conference of the Association for Machine Translation in the Americas) (2008/10/21-25, Hawai'i, USA) JEITA 知識情報処... 続きを読む
MeCab 汎用日本語形態素解析エンジン 工藤 拓 アジェンダ 形態素解析の技術 辞書引きのアルゴリズム、データ構造 曖昧性の解消 MeCab の開発裏話 歴史 設計方針 汎用テキスト変換ツールとしての MeCab 恐ろしく汎用的! 「意外な」使い方 これから 形態素解析 ... 続きを読む
« IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日 キーワード抽出モジュールを作ってみた 一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意... 続きを読む
Yahoo!デベロッパーネットワークにテキスト解析APIが登場! 2007-06-18-1 [WebTool][NLP][MECAPI][Programming] Yahoo!デベロッパーネットワークに「テキスト解析」が登場しました。 第一弾は日本語形態素解析APIです。 ヤフーのいろんなところに使われている W... 続きを読む
Wikipediaのキーワードリンクを使って関連語データを作ってみた 2007-06-09-3 [NLP][Programming][Algorithm] Wikipedia のキーワードリンクを使って関連語データ(関連キーワード集) を作ってみた。 Wikipedia のデータはダウンロードページからbz2形式のを取... 続きを読む
Web関連語抽出を試作 2007-09-04-3 [WebTool][NLP] Web関連語抽出 http://yapi.ta2o.net/kanrenp/ Yahoo!ウェブ検索APIで検索結果100件を取ってきて、形態素解析をかけて、 複合名詞的なものだけ抽出し、出現頻度をカウントして表示します。 ちょっと前に作った... 続きを読む
カイ二乗値で単語間の関連の強さを調べる 2007-09-19-1 [Algorithm][Programming] カイ2乗値を使って単語間の関連度を調べる方法。 つまり、関連語を探すときに、χ二乗値を関連度として使う。 perl によるサンプルコード (chi.pl)。昔、勉強がてら作ったコード... 続きを読む
数式を使わないデータマイニング入門 2007-09-24-3 [書評・感想] ■岡嶋裕史 / 数式を使わないデータマイニング入門 - 隠れた法則を発見する 「データマイニングってなに?なに?なに?」と思ったら、 最初に読むべき本。聞かれたら読ませたい本。 特にIT企業の... 続きを読む
Perlで入門テキストマイニング たつを 2007.10.1 Shibuya Perl Mongers テキストマイニング(1) • 評判情報。ポジティブ、ネガティブ • プロフィール。ブロガーの性別、年齢、地域 • そのページに関連した広告とか。 • 関連語。 • もしかして○○?... 続きを読む
ベイジアンネットワーク技術 2007-10-09-2 [書評・感想] ■本村陽一, 岩崎弘利 / ベイジアンネットワーク技術 - ユーザ・顧客のモデル化と不確実性推論 ベイジアンネットワークとは何かを事例で説明する入門書、ですね。 協調フィルタリングとかパーソナライゼ... 続きを読む
キーワード検索がわかる 2007-10-23-3 [書評・感想] ■藤田節子 / キーワード検索がわかる 本書は、キーワードの本質や、種類と特徴、情報検索のしくみを、 わかりやすい言葉で解説したものです。 (p.9) 検索のリテラシーって大切だよね、ということで、 キーワ... 続きを読む
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基本中の基... 続きを読む
転置インデックスによる検索システムを作ってみよう! 2007-11-26-5 [Algorithm][Programming] 転置インデックス[2007-06-17-6]による検索システムの実装は パフォーマンスを無視すれば意外と簡単です。 それを示すために Perl で簡単な検索システムを作ってみ... 続きを読む
ボタン一つで、不動産のプロと同じ物件判断をしてくれる一発鑑太郎についての情報を紹介します。不動産投資が初心者でも安心 不動産投資で一番悩むのは 物件を選ぶとき。 決して安いとは言えない 金額を支払い物件を購入するわけですから。 ただ、この物件選び... 続きを読む