タグ

ブックマーク / qiita.com/asai0304 (2)

  • Python3を使った日本語自然言語処理(4)ロジスティック回帰による感情分析 - Qiita

    TF-IDFによる単語の関連性の評価とは 前回までで文章をパースし、単語を特徴ベクトルに変換することを行いました。ただ、ある単語がたくさん文章中で存在していても、それがどのカテゴリーの文章でもたくさん登場する単語であれば、カテゴリーを判断する上でその単語の重要性はあまり高くはありません。 ある映画レビューを「肯定的なもの」「否定的なもの」で分類したい時、「すごい」という単語は『すごいつまらなかった』という文脈でも『すごいよかった』という文脈でも頻繁に使われうるので、これだけではそのレビューのネガポジは判断するのが難しいです。 こういった感じで、ある単語がカテゴリーわけを行う際、重要であればその単語の重みをあげ、重要でなければ下げる手法が「TF-IDF」です。TFは単語の出現頻度を、IDFは逆文書頻度と呼ばれ、定義は以下のようになります。 $n_d$はドキュメントの総数、$df(t, d)$

    Python3を使った日本語自然言語処理(4)ロジスティック回帰による感情分析 - Qiita
  • 理系学部留学のススメ - Qiita

    こんばんは。 今回は理系学部留学について書きたいと思います。 ちなみに書いてる人は今日の10時頃に「アドベントカレンダーの進捗が3行なんですけど広義今日って許されますか」なんていうツイートをしていたくらいなのでクオリティはごめんなさい。 自己紹介 EEIC2017で、去年の8月から今年の5月まで、アメリカのカリフォルニア大学バークレーに留学していました。 理系での(実際には留学を始めた時は文系だったのですがそれはおいといて) 学部留学や海外大学での理系の授業について聞かれることが多いので、今回アドベントカレンダーで扱ってみることにしました。 今回はよく聞かれる どんな授業があるの? 授業以外でどんなことするの? ぶっちゃけ理系学部留学って必要? の三つを中心に書いていこうと思います。 はいここで技術的な話を期待していた方そっとウィンドウを閉じていただけると嬉しいです。 ただ1の項目でいくつ

    理系学部留学のススメ - Qiita
  • 1