【特別連載】さぁ、自然言語処理を始めよう！（最終回：機械学習によるテキストマイニング）

テクノロジーカテゴリーの変更を依頼記事元:

datumstudio.jp

16 usersがブックマークコメント

記事へのコメント1件

注目コメント
新着コメント

ottonove 自然言語処理

2017/09/11 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

<iframe marginwidth="0" marginheight="0" src="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fdatumstudio.jp%2Fblog%2F%25E3%2580%2590%25E7%2589%25B9%25E5%2588%25A5%25E9%2580%25A3%25E8%25BC%2589%25E3%2580%2591-%25E3%2581%2595%25E3%2581%2581%25E3%2580%2581%25E8%2587%25AA%25E7%2584%25B6%25E8%25A8%2580%25E8%25AA%259E%25E5%2587%25A6%25E7%2590%2586%25E3%2582%2592%25E5%25A7%258B%25E3%2582%2581%25E3%2582%2588%25E3%2581%2586%25EF%25BC%2581-3%2F" scrolling="no" frameborder="0" height="230" width="500"><div class="hatena-bookmark-detail-info"><a href="https://datumstudio.jp/blog/%E3%80%90%E7%89%B9%E5%88%A5%E9%80%A3%E8%BC%89%E3%80%91-%E3%81%95%E3%81%81%E3%80%81%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E5%87%A6%E7%90%86%E3%82%92%E5%A7%8B%E3%82%81%E3%82%88%E3%81%86%EF%BC%81-3/">【特別連載】 さぁ、自然言語処理を始めよう！（最終回： 機械学習によるテキストマイニング）</a><a href="https://b.hatena.ne.jp/entry/s/datumstudio.jp/blog/%E3%80%90%E7%89%B9%E5%88%A5%E9%80%A3%E8%BC%89%E3%80%91-%E3%81%95%E3%81%81%E3%80%81%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E5%87%A6%E7%90%86%E3%82%92%E5%A7%8B%E3%82%81%E3%82%88%E3%81%86%EF%BC%81-3/">はてなブックマーク - 【特別連載】 さぁ、自然言語処理を始めよう！（最終回： 機械学習によるテキストマイニング）</a></div></iframe>

プレビュー

規約違反を報告

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

【特別連載】さぁ、自然言語処理を始めよう！（最終回：機械学習によるテキストマイニング）

みなさまこんにちは。前回の連載【特別連載】さぁ、自然言語処理を始めよう！（第2回：単純集計によ... みなさまこんにちは。前回の連載【特別連載】さぁ、自然言語処理を始めよう！（第2回：単純集計によるテキストマイニング）では TF-IDF を用いて Twitter Streaming API 経由で取得した日本語 Tweet データから、ある日の特徴語を抽出する方法を紹介しました。今回は機械学習を用いたテキストマイニングを行いたいと思います。機械学習とは「経験により自動的に改善していく」コンピュータープログラムの構築方法に関わる分野です。具体的には Python の機械学習用ライブラリである scikit-learn を用いて、集めた Tweet データを「ポジティブ」、「ネガティブ」なものに自動で分類する方法を紹介します。処理の流れ今回行う処理は次のような流れになります。学習用データの作成データの前処理手法の選択モデルの学習未知要素の分類実行環境は前回、前々回で使用した A