タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

elasticsearchとsearchEngineに関するnishikawasasakiのブックマーク (3)

  • Elasticsearch キーワードサジェスト日本語のための設計

    Google に代表される「キーワードサジェスト」機能を Elasticsearch を前提に日語向けに設計。 よくある要件サイト内で過去に検索された有効なキーワードをサジェストしたい。入力されたテキストに関連性が高く、過去に検索された回数の多い順でサジェストしたい。最初に入力された言葉の後に空白を入力すると、最初の言葉と一緒に検索される複合語の候補サジェストしたい比較的シンプルな要件のように見えますが。。日語を対象にしたサジェスト機能を実装する場合、入力途中の日語のテキスト受けながら、ひらがな、カタカナ(半角・全角)、漢字、ローマ字(大文字・小文字・全角・半角)のコンビネーションを合わせて、関連性の高い言葉を素早くユーザーに提案しなければなりません。以外と難しいのです。。 Elasticsearch にも Completion Suggester と言うサジェスト向けの機能があるの

    Elasticsearch キーワードサジェスト日本語のための設計
  • Elasticsearch Field Collapsing | DevelopersIO

    Elasticsearch 5.3 がリリースされましたね。今回はその New feature の中で、Field Collapsing について紹介したいと思います。 Field collapsing と言えば、Top hits aggregation が思い浮かぶ方も多いかと思いますが、今回リリースされた New Field collapsing の機能は Aggregation ではなく、検索結果そのものを折りたたむことができます。 検索系の機能名称では、Collapse Search / Field collapsing / Result grouping と言ったりしますが、一般的に日語では何って呼ばれてるのだろう?折りたたみ検索? 指定されたフィールドの値を使って、検索結果の重複を排除するような機能です。 ユースケース例 例えば、EC サイトの商品検索で、カラーやサイズなどの

    Elasticsearch Field Collapsing | DevelopersIO
  • FRILの商品検索をnGramから形態素解析にした話 - mosowave

    この記事はElasticsearch Advent Calendar 2015の7日目のエントリです。 こんにちは、ファッションフリマアプリFRILを運営しているFablicでエンジニアをしている@sinamon129です。 FRILの商品検索はElasticsearchを使っていて、最近nGramベースだったものを形態素解析ベースに変更しました。 その経緯やどういう手順で行ったかを書こうと思います。 主にユーザー辞書とsynonym辞書の構築の話がメインです。 どうしてnGramベースから形態素解析ベースに変更することになったか 関係ないものがなるべくひっかからないようにしたい nGramだとファーで検索したときに、ローファーやローリーズファームが引っかかり、当に検索したかったものが出てこないという問題がありました。 (実際は出ているのだけども、埋もれてしまっている状態) 同じ意味の単

    FRILの商品検索をnGramから形態素解析にした話 - mosowave
  • 1