[B! programming][NLP] ICHIROのブックマーク

DO++

2012年の個人的な総括を以下にまとめます。子供が生まれました無事子供が7月に生まれました。毎日子育てに翻弄していますが想像していたよりも大変で楽しい時間を過ごしています。また、妻が実家に里帰り出産したため夏の間は、毎週末妻の実家に帰り車を運転して病院・お店に行くという、まるで妻の実家で生活して月〜金は東京で働いているような感覚で過ごしていました。高速文字列本を出しました高速文字列の世界を12/27に出しました。 2012年の目標として本をだすということを考えていました。2010年夏頃から本の話はいただいていましたが、結婚、会社（途中から経営陣に入ってさらに時間確保が困難に）、子育てと時間確保がどんどん困難になっていきずるずると伸びてしまっていました。しかし、文字列解析の話は小さいころから扱っていた話（もう10歳ぐらいからの付き合い）で一度まとめてみたかったというのもありますし

ICHIRO 2009/05/19

リンク

新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転改

新はてブ正式リリース記念ということで。もうリリースから何週間も経っちゃったけど。新はてなブックマークではブックマークエントリをカテゴリへと自動で分類しているが、このカテゴリ分類に使われているアルゴリズムはComplement Naive Bayesらしい。今日はこのアルゴリズムについて紹介してみる。 Complement Naive Bayesは2003年のICMLでJ. Rennieらが提案した手法である。ICMLというのは、機械学習に関する（たぶん）最難関の学会で、採択率はここ数年は30%を切っている。2003は119/371で、32.1%の採択率だったようだ。 Complement Naive Bayesの位置づけは実装が簡単学習時間が短い性能もそこそこよいという感じで、2003年段階にあっても、絶対的な性能ではSVMに負けていた。しかし、学習が早いというのは実アプリケーシ

ICHIRO 2008/12/17

リンク

Wikipediaのキーワードリンクを使って関連語データを作ってみた

Wikipediaのキーワードリンクを使って関連語データを作ってみた 2007-06-09-3 [NLP][Programming][Algorithm] Wikipedia のキーワードリンクを使って関連語データ（関連キーワード集）を作ってみた。 Wikipedia のデータはダウンロードページからbz2形式のを取ってきた。日本のウィキペディアのXMLデータね。 (see Wikipedia:データベースダウンロード) で、Perlスクリプトで以下の関連語データ作成処理を行った。（スクリプトはこの記事の末尾に載せておく） (1) 各キーワードページに含まれているキーワード（リンク）を取り出す。例えばキーワードAのページにB,C,Dが含まれていたら、A => B,C,D というデータを蓄積。またキーワードAが他のキーワードのページ（例えばX）に含まれていたら、それも蓄積。その場合

ICHIRO 2008/06/24

自然言語処理

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

programmingとNLPに関するICHIROのブックマーク (3)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (7)

programmingとNLPに関するICHIROのブックマーク (3)

DO++

新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転 改

Wikipediaのキーワードリンクを使って関連語データを作ってみた

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転改