タグ

nlpに関するnakaearthのブックマーク (2)

  • GiNZA+Elasticsearchで係り受け検索の第一歩 - Taste of Tech Topics

    急に冷え込んできてお布団が恋しい季節になってきました。 こんにちは。@Ssk1029Takashiです。 この記事は自然言語処理 Advent Calendarの6日目の記事になります。 qiita.com 全文検索システムは単語検索であることが多いですが、単語検索だけだと困ることもあります 症例検索を例にとって見てみましょう。 検索エンジンに以下の2つの文章が登録されているとします。 「ずっと胃がキリキリと痛い。ただ、熱は無く平熱のままだ。」 「昨日からとても頭が痛い。おまけに胃がむかむかする。」 この時、「胃が痛い」と検索したとき、通常の単語検索の場合だと両方ともヒットしてしまいますが、下の文章は意味としては異なる文章のためゴミになります。 この記事では、GiNZAとElasticsearchを使って意味的に正しい上の文章だけを拾ってくる仕組みを簡単に実現してみようと思います。 どうや

    GiNZA+Elasticsearchで係り受け検索の第一歩 - Taste of Tech Topics
  • Lucene #Kuromoji のコードを読む会 (辞書ビルダー編) - Speaker Deck

    Transcript Lucene Kuromoji のコードを読む会 (辞書ビルダー編) 2019/10/3 @moco_beta 自己紹介  打田智子  twitter : @moco_beta  所属 : 株式会社 LegalForce R&D チーム / ソフトウェアエンジニア  検索システムに興味があります  趣味でOSS開発をしています  Janome https://github.com/mocobeta/janome  Apache Lucene committer () 趣旨など 主催者 (@moco_beta) が Lucene / Kuromoji のソースコード(辞書周り)を読むうえで,調 べたことをまとめておきたい 素のままで触る機会は少ないかもしれないけれ ど, Lucene のコードを読んでみるのも楽しい よ!というのを伝えたい 仕事ではブラック

    Lucene #Kuromoji のコードを読む会 (辞書ビルダー編) - Speaker Deck
  • 1