はじめに 与えられた文字列を含む文書を返す検索機能を実装しているところを想像してください。 検索語として「ページ」が与えられれば、「ページ」という文字列を含む文書を返します。これは特に難しいことではありません。 半角の「ページ」が与えられたらどうでしょう。「ページ」と「ページ」を区別する必要がないような、一般的な文書検索においては、「ページ」という文字列を含む文書を返すのが望ましいはずです(もちろん、この2つは常に同一視できるわけではありません。同一視できない例として本稿があります)。 もしかした... > このページを見る
最終更新時間:
2008年07月15日15時11分
みんなのブックマーク 人気(0) 新着
- 名寄せみたいなもんか?
- 正規化について
- だが絵文字というものもある
- PEAR::I18N_UnicodeNormalizer
- PHPはいろいろ面倒だなぁ。。。







