これまでキーの参照頻度が一様分布に従うという無茶な仮定の下で実験をすることが多かったのですが,遷移キャッシュを導入したということもあり,冪乗則だとどうなるのかを調べてみました.実験に用いたデータは,日本語ウェブコーパスにおける頻度 1000 以上の単語 N-gram です. N-gram コーパス - 日本語ウェブコーパス 2010 http://s-yata.jp/corpus/nwc2010/ngrams/ 単語 N-gram コーパスの頻度情報を利用すれば,冪乗則が成立する状況を再現できます.すなわち,一部の高頻度な N-gram が全体に対して大きな割合を占め,ほとんどの N-gram は稀に出現するのみとなります. 遷移キャッシュの効果は高頻度の遷移を高速化することであり,参照頻度が冪乗則に従う状況であれば,より高い効果が期待できます. 実験結果(Google Document)