Pythonで自然言語処理をしてみる_トピックモデル - あれもPython,これもPython

テクノロジーカテゴリーの変更を依頼記事元:

esu-ko.hatenablog.com

9 usersがブックマークコメント

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

<iframe marginwidth="0" marginheight="0" src="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fesu-ko.hatenablog.com%2Fentry%2F2016%2F03%2F24%2FPython%25E3%2581%25A7%25E8%2587%25AA%25E7%2584%25B6%25E8%25A8%2580%25E8%25AA%259E%25E5%2587%25A6%25E7%2590%2586%25E3%2582%2592%25E3%2581%2597%25E3%2581%25A6%25E3%2581%25BF%25E3%2582%258B_%25E3%2583%2588%25E3%2583%2594%25E3%2583%2583%25E3%2582%25AF%25E3%2583%25A2%25E3%2583%2587%25E3%2583%25AB" scrolling="no" frameborder="0" height="230" width="500"><div class="hatena-bookmark-detail-info"><a href="https://esu-ko.hatenablog.com/entry/2016/03/24/Python%E3%81%A7%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E5%87%A6%E7%90%86%E3%82%92%E3%81%97%E3%81%A6%E3%81%BF%E3%82%8B_%E3%83%88%E3%83%94%E3%83%83%E3%82%AF%E3%83%A2%E3%83%87%E3%83%AB">Pythonで自然言語処理をしてみる_トピックモデル - あれもPython,これもPython</a><a href="https://b.hatena.ne.jp/entry/s/esu-ko.hatenablog.com/entry/2016/03/24/Python%E3%81%A7%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E5%87%A6%E7%90%86%E3%82%92%E3%81%97%E3%81%A6%E3%81%BF%E3%82%8B_%E3%83%88%E3%83%94%E3%83%83%E3%82%AF%E3%83%A2%E3%83%87%E3%83%AB">はてなブックマーク - Pythonで自然言語処理をしてみる_トピックモデル - あれもPython,これもPython</a></div></iframe>

プレビュー

規約違反を報告

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

Pythonで自然言語処理をしてみる_トピックモデル - あれもPython,これもPython

Pythonで自然言語処理を行いたい場合、選択肢は、 NLTK Sci-kit learn gensim があります。 NLTKはフル... Pythonで自然言語処理を行いたい場合、選択肢は、 NLTK Sci-kit learn gensim があります。 NLTKはフルスタックなツールで、下記の本でも丁寧に記載されています。 sklearnはtf-idfなどを扱うためのクラスを持っています。で、最近は残りのgensimを勉強しています。でもその前に日本語で自然言語処理を行う場合、単語ごとの分割が問題になってきます。英語などは単語ごとに空白が入っているので、splitしやすいのですが、日本語だとその分割作業があります。 Pythonだと、 Pythonのmecabラッパーやjanomeなどで、この作業が可能です。 esu-ko.hatena blog.com で、gensim gensimは結構色々な作業が可能です。有名ドコロでは、word2vecがあります。が、今回はトピックモデルについて勉強しました。