2. ⾼高速⽂文字列列解析の世界 宣伝 データ圧縮・全⽂文検索索・テキストマイニング l 岩波書店 l 「確率率率と情報の科学」シリーズ l 5巻発⾏行行済, 全18巻 l 2012/12/27 発⾏行行 l 著者:岡野原⼤大輔 l 編者:⽢甘利利俊⼀一、⿇麻⽣生英樹、伊庭幸⼈人 l 新しい⽂文字列列解析の技術を初めて解説 l Burrows Wheeler変換 l 簡潔データ構造 l ウェーブレット⽊木(今回紹介) 2
2. ⾼高速⽂文字列列解析の世界 宣伝 データ圧縮・全⽂文検索索・テキストマイニング l 岩波書店 l 「確率率率と情報の科学」シリーズ l 5巻発⾏行行済, 全18巻 l 2012/12/27 発⾏行行 l 著者:岡野原⼤大輔 l 編者:⽢甘利利俊⼀一、⿇麻⽣生英樹、伊庭幸⼈人 l 新しい⽂文字列列解析の技術を初めて解説 l Burrows Wheeler変換 l 簡潔データ構造 l ウェーブレット⽊木(今回紹介) 2
「高速文字列解析の世界」という大変すばらしい本が発売された。わりと敷居が高い本ではあるので読む前に知っておくとよさそうなことを書いておく。 「高速文字列解析」とは 本書でいう高速文字列解析というのは主に2つのことを指している。ひとつはデータを圧縮して小さくしてディスクよりメモリ、メモリよりキャッシュというようにより高速な記憶装置で扱いましょう、という話。もうひとつはデータ構造を工夫することで複雑な操作もそこそこ高速に扱えますよ、という話。つまり「圧縮」の話と「効率的なデータ構造」の話があると考えておくと良い。 キーワードは3つ オビにも書いてあるけれど、本書が主に扱うのは「BWT」「簡潔データ構造」「ウェーブレット木」の3つ。具体的には「BWT」が「圧縮」に関わっていて「ウェーブレット木」が「効率的なデータ構造」に関わっている。「簡潔データ構造」は基本的な道具として本書の色々なところで出て
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く