タグ

2023年1月7日のブックマーク (2件)

  • How People Use Google Search (New User Behavior Study)

    mookie
    mookie 2023/01/07
    Google検索のユーザ調査結果まとめ ①検索セッションの23%の時間がサジェストに費やされている ②平均的な検索セッションは完了までに76秒かかる
  • 日本語サジェスト機能の実装にあたり試行錯誤した話 - コネヒト開発者ブログ

    こんにちは。エンジニアの永井(shnagai)です。 今回は、現在進めている検索システム内製化プロジェクトの中で、日語サジェストを実装するために試行錯誤した話を書こうと思います。 内容は、ざっくり下記の構成になっています。 日語サジェストの難しいところ よりよい日語サジェストのために試行錯誤した点 この記事はコネヒトアドベントカレンダー2022の16日目の記事です。 日語サジェストの難しいところ 日語のサジェストをOpenSearch(Elasticsearch)で実装するにあたりいくつか難しい点がありました。 この話の前提として、コネヒトではインデックス作成に使えるデータとして下記を持っています。 検索ログデータ 検索対象のテキストデータ 以後の話はこのデータを使いサジェストを実装する際に、どのような点を意識したかについて話していきます。 ①よみがなの考慮 サジェストの実装を考

    日本語サジェスト機能の実装にあたり試行錯誤した話 - コネヒト開発者ブログ
    mookie
    mookie 2023/01/07
    日本語サジェストの難しい点 ①よみがなの考慮 ②単語の区切り 日本語サジェストのために試行錯誤した点 ① 検索ログ活用のために、kuromojiで形態素解析はせずkeywordトークナイザーを使う ② カスタム辞書にカナを振る