こんにちは。エンジニアの永井(shnagai)です。 今回は、現在進めている検索システム内製化プロジェクトの中で、日本語サジェストを実装するために試行錯誤した話を書こうと思います。 内容は、ざっくり下記の構成になっています。 日本語サジェストの難しいところ よりよい日本語サジェストのために試行錯誤した点 この記事はコネヒトアドベントカレンダー2022の16日目の記事です。 日本語サジェストの難しいところ 日本語のサジェストをOpenSearch(Elasticsearch)で実装するにあたりいくつか難しい点がありました。 この話の前提として、コネヒトではインデックス作成に使えるデータとして下記を持っています。 検索ログデータ 検索対象のテキストデータ 以後の話はこのデータを使いサジェストを実装する際に、どのような点を意識したかについて話していきます。 ①よみがなの考慮 サジェストの実装を考
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く