エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Dec 14th, 2017: [JP][Elasticsearch] Analyze APIを使って、転置インデックスとテキスト解析を理解する
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Dec 14th, 2017: [JP][Elasticsearch] Analyze APIを使って、転置インデックスとテキスト解析を理解する
Elasticsearchを利用して、検索しているときに、想定していない単語にヒットすることがありませんか? ... Elasticsearchを利用して、検索しているときに、想定していない単語にヒットすることがありませんか? 望んだ形で検索できる仕組みを作るためには、転置インデックスと入力された文章を解析する仕組みを理解するのが一番の近道です。 転置インデックスとは? 全文検索のインデックスとして用いられるデータ形式の1つです。 書籍の後ろにある「索引」(Index)を想像していただくのが一番わかりやすいのですが、 調べたい「単語」を見つけると、その単語が出てくる「ページ番号」がわかります。 これが書籍の索引です。書籍の場合は、著者や編集者が索引に載せるべき単語を抽出します。 転置インデックスの場合は、この索引に当たる構造を全ての「単語」に対して作成します。 また、「ページ番号」の代わりに「ドキュメントID」を用いる形になります (実際にはそれ以外の情報もインデックスには入っていますが、ここでは省略しま