タグ

検索に関するnabeatsu1のブックマーク (2)

  • 曖昧検索asearch

    曖昧検索は便利なものである。「ピテカントロプス」の綴りは難しいが、最近のGoogle検索は曖昧検索対応しているようで、「pitekantoropusu」で検索してもちゃんと直立猿人(Pithecanthropus)がみつかる。しかし「musogurusuki-」でムソルグスキーを検索できないようなので、改良の余地はあるのかもしれない。 Unix系の計算機システムやプログラミング言語では曖昧な検索を行なうために正規表現を使えるものが多い。正規表現とは検索パタンとして文字列の繰り返しや文字列の選択を指定できるもので、a*という表現で「0回以上のaの繰り返し」というパタンを指定したり、(abc|def)という表現で「abcまたはdef」を指定したり、a.cという表現で「aac, abc, acc, ...」を指定したりできる。たとえばpi.*ca.*puのような曖昧なパタンを指定すれば辞書からP

    曖昧検索asearch
  • 橋本商会 » あいまいテキスト検索 AsearchをNodeに移植した

    asearchという文字列が似ているかどうか判定するrubygemがある。 増井先生が作ったもので、gyazzのページ名サジェストなどに使われている。 それをnodeに移植した。 https://npmjs.org/package/asearch https://github.com/shokai/node-asearch 特徴 はやい byte列を比較しているだけ 結果はtrue/falseで返ってくる あいまい度は指定できる(0〜3まで) 他のライブラリに依存していない、pure javascript たぶんブラウザでも動くのであとで試してみる。 インストール npm install asearch 使い方 Asearch = require 'asearch' a = new Asearch 'abcde' console.log a.match 'abcde' # => true

    橋本商会 » あいまいテキスト検索 AsearchをNodeに移植した
  • 1