Python3を使った日本語自然言語処理(4)ロジスティック回帰による感情分析 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/asai0304

16users がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Python3を使った日本語自然言語処理(4)ロジスティック回帰による感情分析 - Qiita

TF-IDFによる単語の関連性の評価とは前回までで文章をパースし、単語を特徴ベクトルに変換することを行... TF-IDFによる単語の関連性の評価とは前回までで文章をパースし、単語を特徴ベクトルに変換することを行いました。ただ、ある単語がたくさん文章中で存在していても、それがどのカテゴリーの文章でもたくさん登場する単語であれば、カテゴリーを判断する上でその単語の重要性はあまり高くはありません。ある映画レビューを「肯定的なもの」「否定的なもの」で分類したい時、「すごい」という単語は『すごいつまらなかった』という文脈でも『すごいよかった』という文脈でも頻繁に使われうるので、これだけではそのレビューのネガポジは判断するのが難しいです。こういった感じで、ある単語がカテゴリーわけを行う際、重要であればその単語の重みをあげ、重要でなければ下げる手法が「TF-IDF」です。TFは単語の出現頻度を、IDFは逆文書頻度と呼ばれ、定義は以下のようになります。 $n_d$はドキュメントの総数、$df(t, d)$

ブックマークしたユーザー

equinox792017/09/29
knaka20blue2017/09/24
hohoho_ho20052017/02/20
Hiro_Matsuno2017/02/20
Jyuichi2017/02/20
alaluta2017/02/20
seven-teen-rocket2017/02/20
izahiro1382017/02/20
taichi6962017/02/20
challysen1982017/02/20
ysog2017/02/20
kenzy_n2017/02/20
clavier2017/02/20
ryshinoz2017/02/20
netcraft32017/02/20

同じサイトの新着

理系学部留学のススメ - Qiita

4 usersqiita.com/asai0304

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx