タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

algorithmとPHPに関するk1LoWのブックマーク (1)

  • S1100: levenstein~PHPで編集距離 その2

    2009年3月24日 levenstein~PHPで編集距離 その2 カスタム関数でのマルチバイト対応は、冷静になったら出来た。遅さに関しては、冷静に考えてキーワードはそんなにたくさん要らないのでキーワード登録を1,000位にしたら気にならなくなった。(たくさんアクセスが来たら問題かもしれないが)bigramインデックスを作ることも頭によぎったが、今そこまでしなくていいかなと。 組み込みであったlevenshtein()関数は結構便利そうなのだが、EUC-JPでテストしても日語対応できていない気がする。levenshtein('あいう', 'いう',1,1,1);の結果が2っておかしい。挿入以外は正しい距離が出るときもあるようだが、使い物にはならない。(PHP5.2.8) CakePHPのモデルを作った。キーワードのテーブルを作り、上記のような検索関連の関数を収録した。 作っていろいろキ

    k1LoW
    k1LoW 2009/04/02
    levenstein multibyte
  • 1