![https://developer-collaboration.com/2019/01/30/elasticsearch-kuro-dictionary-synonym/](https://cdn-ak-scissors.b.st-hatena.com/image/square/b55c5c4b3c458cf35fa21c54e6ac9fcf838e6bbc/height=288;version=1;width=512/https%3A%2F%2Fdeveloper-collaboration.com%2Fwp-content%2Fuploads%2F2018%2F08%2FElasticsearch-Horizontal-Text-Full-Color-1024x466.png)
Elasticsearchの類義語辞書を動的に更新する方法の調査: codelibs/elasticsearch-analysis-synonymElasticsearch検索辞書類義語 概要 elasticsearchで類義語を扱うための機能であるsynonym token filterは、類義語辞書の内容の更新を検索に反映する場合、ノードの再起動か、インデックスのクローズ・オープンが必要となっています。 しかし、数十台からなるElasticsearchクラスタを運用している場合、クラスタの全ノードを再起動するとなると結構大変ですし、ましてやインデックスのクローズ・オープンはサービスの停止が必要になってしまうので、そう簡単にできるものでもないでしょう。。。 類義語辞書は日々更新されるものなので、できるだけ低コストで検索に反映したいものです。 というわけで、elasticsearchのsy
Elasticsearch の特徴の一つスキーマレス(事前のスキーマ定義なしにデータをインデックスできる機能)ですが、日本語ではなかなかこの恩恵を受けることが出来ません。アナライザーを日本語向けにカスタマイズしたり、一つのフィールドでも日本語、ファセット、などコンテンツの内容と、いろいろな用途で使用することを考慮して、マッピング定義を設計する必要があるからです。 せっかくスキーマレスな検索エンジンなのに毎回マッピング定義をいちいちするのもめんどいと思うのは私だけでしょうか?と言うことで、動的マッピングを使って日本語でもスキーマレス環境の構築を考えたいと思います。 目指すは、検索の高度な知識を習得しなくても簡単に使える環境! 使用する主な機能日本語環境でもスキーマレスな環境を手に入れる為に以下の機能を使用しました。 インデックステンプレート(Index Templates) インデックステン
Elasticsearchでサジェスト機能を使いたいんだけど、英語でのネタしか見つからなかったので、日本語でサジェストするメモ。 例えば「と」と打って「東京都」が出てきてほしいけど、そのままデータ登録しても「東」じゃないと出てこない。 なので、Kuromojiのカタカナ変換機能を使ってやってみた。 インデックス作成 まずインデックスの作成と設定。(例として「suggest_test」というインデックス名) // curl -X PUT 'localhost:9200/suggest_test' -d { "settings": { "analysis":{ "analyzer" : { "katakana_analyzer" : { "tokenizer" : "kuromoji_tokenizer", "filter" : ["katakana_readingform"] } }, "f
ClojureとKuromojiを使った、面白そうなエントリがあったので Clojure/kuromojiでテキストマイニング入門 〜形態素解析からワードカウントまで〜 http://antibayesian.hateblo.jp/entry/2013/09/10/231334 Luceneに入っているKuromojiを使って書き直してみました。 プロジェクトの作成。 $ lein new app lucene-kuromoji project.clj (defproject lucene-kuromoji "0.1.0-SNAPSHOT" :description "FIXME: write description" :url "http://example.com/FIXME" :license {:name "Eclipse Public License" :url "http://
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く