SimStringは,類似文字列検索のための高速かつシンプルなライブラリです。 簡単にいえば「もしかして:〇〇」を簡単に実装できるライブラリですね。 詳しくは公式サイトを見てください。http://www.chokkan.org/software/simstring/ このライブラリはC++でできているのですが、公式サイトを見るとPythonとRubyからも扱えるとのこと。Pythonのサンプルが載っていて普段ならこれでなんの問題もないのですが、最近仕事でRubyをやっているのでRubyから使う方法が知りたくて調べました。 ビルド方法 基本的には公式サイトの手順で問題ないのですが、注意点が少し有ります。 Ruby1.9系はインストール出来ない Macだとインストールはできるが、なんか動かない(っぽい) CentOS5.5にruby1.8.7だとあっさりできました。 データ投入 一番簡単なの