渋日記@shibu.jp 渋川よしきの日記です。ソフトウェア開発とか、ライフハックを中心に記事を書いていきます。 写真は内容とは関係なく、栃木県宇都宮市のスフィンクスです。闇夜にいきなり現れるとかなりコワイです。 Sphinxの検索機能の日本語対応をしてみました。リンク先にはパッチ済みのSphinxが置いてあります。Sphinxは検索関連に関しては、かなり英語にハードコードされていましたので。やったことは以下の通り。 日本語対応のSplitterの作成 設定オプションに検索言語切り替えを追加 stemmingアルゴリズム、 stop wordsも検索言語と連動して切り替わるように変更 Sphinx-devのメーリングリストに、機能拡張要望をメール 日本語対応のSplitterの作成 まずやってみたのはSplitterの作成。Sphinxでは欧米言語を想定しているので、re.compile(