エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
文法圧縮(1) - 気ままなブログ
ビットベクトルの完備辞書のさらなる圧縮のために、文法圧縮について調べている。かなり奥が深いようだ... ビットベクトルの完備辞書のさらなる圧縮のために、文法圧縮について調べている。かなり奥が深いようだ。自分のメモとして、調査したことをしばらく書いていく。 Re-Pair(is the recursive replacements of all pairs)を応用した完備辞書を実装しようと思った関係上、Re-Pairについて調べている。Re-Pairの概要はとても簡単で、誰でも理解できる。テキスト上に最頻出するバイグラム(2文字)をテキスト中に出現しない文字で置き換えるということを繰り返し、その変換ルールと変換した文字列を保存することで圧縮するアルゴリズムである。 以下に例を示す。 Text: aaabacaaabccaaab 1. 「D -> aa」というルールを適用する。 Text: DabacDabccDab 2. 「E -> Da」というルールを適用する。 Text: EbacEbcc