タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

多言語化に関するjqk77のブックマーク (2)

  • Elasticsearch多言語化その2

    投稿は、Elastic stack (Elasticsearch) Advent Calendar 2016 の2日目の記事かつ、以前書いた以下の投稿の続編。 Elasticsearch の analyzer 関連の設定で知ってることを全て書く Elasticsearch多言語化その1 背景等 以前書いた内容と重なる部分もあるが、背景等について説明しておく。 Elasticsearch を、各種開発者向けサービスの横串検索用に使用 GitHub, Slack, Google Drive 等のデータを API 経由で取ってきて、Elasticsearch に入れて、それを横串・一括検索出来るようなツールを作っている。元々は内部向けのツールだったが、ぼちぼち体裁等が整って来たので、現在β版的な感じでひっそり公開中。(今年中にはちゃんと公開したい。) 詳細はこちら → GitHub も、Sla

    Elasticsearch多言語化その2
  • Elasticsearch多言語化その1

    英語でもそこそこの検索結果が出て欲しい 以前、Elasticsearch の analyzer 関連の投稿を書いた。 Elasticsearch の analyzer 関連の設定で知ってることを全て書く Elasticsearch を何に使っているかなどは、詳しくはそちらを参照してもらうとして、ポイントだけ抜粋しておく。 GitHub, Slack, Google Drive, ChatWork, Backlog などからAPI経由でデータを取ってきて、インデックスを作成 言語は、日語がメインだけど、海外の人とのやりとりや、英語のwebページ(StackOverflowとか)からのコピペもあるので、英語もある程度使われている。 現状は、日語にのみ対応した設定だけど、英語もそこそこ使われているので、英語の検索結果もそれなりの精度になって欲しい、というのが今回の話。 やったこと: 英語

    Elasticsearch多言語化その1
  • 1