エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Pythonで自然言語処理をしてみる_トピックモデル - あれもPython,これもPython
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Pythonで自然言語処理をしてみる_トピックモデル - あれもPython,これもPython
Pythonで自然言語処理を行いたい場合、 選択肢は、 NLTK Sci-kit learn gensim があります。 NLTKはフル... Pythonで自然言語処理を行いたい場合、 選択肢は、 NLTK Sci-kit learn gensim があります。 NLTKはフルスタックなツールで、 下記の本でも丁寧に記載されています。 sklearnはtf-idfなどを扱うためのクラスを持っています。 で、最近は残りのgensimを勉強しています。 でもその前に 日本語で自然言語処理を行う場合、 単語ごとの分割が問題になってきます。 英語などは単語ごとに空白が入っているので、splitしやすいのですが、 日本語だとその分割作業があります。 Pythonだと、 Pythonのmecabラッパーやjanomeなどで、 この作業が可能です。 esu-ko.hatenablog.com で、gensim gensimは結構色々な作業が可能です。 有名ドコロでは、word2vecがあります。 が、今回はトピックモデルについて勉強しました。