エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Pythonで自然言語処理〜WhooshとMecabを使って簡単全文検索〜 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Pythonで自然言語処理〜WhooshとMecabを使って簡単全文検索〜 - Qiita
はじめに PythonのWhooshとMecabを使用して全文検索を行います。 全文検索とは、その名の通りある文章の... はじめに PythonのWhooshとMecabを使用して全文検索を行います。 全文検索とは、その名の通りある文章の中に指定の単語が含まれているかを調べる検索です。 使用データ、環境など 今回使用するデータはwikipediaデータ(2.7GB)ですが好きなテキストデータで行えるので各人でデータを用意してください。 wikiのデータを使用したい場合はこちらからjawiki-latest-pages-articles.xml.bz2をダウンロードしてWikipedia Extractorを使用することで記事ごとに<doc> </doc>で囲まれたテキストデータが得られるみたいです。(配布されたものを使用するので、自分ではこの方法を試していないです。) Anaconda Python3.6使用 (Python2でも実行出来る可能性はあります。) Windows, Mac, Linux(Ubun