makimotoのブックマーク / 2007年11月22日

http://dp04022987.lolipop.jp/blog/2007/11/r.html

makimoto 2007/11/22

r
clustering

リンク

個別「20070614024426」の写真、画像 - naoyaの写真

ユーザー登録ログインヘルプ next> <prev 20070614 NIKON D80 50.00mm f/2.50 Trackback - http://f.hatena.ne.jp/naoya/20070614024426 naoyaのはてなダイアリーしなもん日記規約違反を通報するはてなフォトライフ / はじめての方へ / はてなブログ

makimoto 2007/11/22

inu

リンク

DO++ : マルコフ情報源上で次の文字を予測する

文字列（単語列）を解析する際、i番目の文字はその直前(N-1)文字のみ依存するというマルコフ情報源を仮定することはいろいろな場面で現れます。例えば音声認識とか機械翻訳では、次の単語を直前(N-1)単語を使って予測するというN-gramモデルが古くから今でも使われてますし、データ圧縮でもこれと全く同じように履歴を使って次の文字を予測し、その予測確率を用いて符号化するPPMモデルがあります。ここで問題になるのは、何文字前まで見れば次の文字を予測できるかということが一般のデータだと分からないということです。例えば4文字前まで見た場合より5文字前まで見たほうが次の文字が確実に予想できそうですが、4文字前までは過去のデータで何回もでているのに5文字になると途端に出現回数が少なくなってサンプル数が少なくなってしまい予測精度が低下してしまう問題があります。そのため大抵は1,2,3..,N文字前の文

makimoto 2007/11/22

nlp

リンク

はてなブックマーク

タグ

2007年11月22日のブックマーク (3件)

http://dp04022987.lolipop.jp/blog/2007/11/r.html

個別「20070614024426」の写真、画像 - naoyaの写真

DO++ : マルコフ情報源上で次の文字を予測する

お知らせ

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス