
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Twitterユーザーの性別を機械学習で予測する - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Twitterユーザーの性別を機械学習で予測する - Qiita
性別がタグ付けされたTwitterユーザー 2万人分のデータがあったので、このデータを使ってTwitterユーザ... 性別がタグ付けされたTwitterユーザー 2万人分のデータがあったので、このデータを使ってTwitterユーザーの性別予測を行ってみた。テキスト処理にはRuby、機械学習にはPythonを使っている。 先に結論 Twitterのプロフィールを用いた単純な機械学習による性別予測は、約60%の精度しかでなかった。 今回用いたデータは外国語のデータであり、日本語のプロフィールだと違った結果になるが、精度は同じようにあまりでないと思われる。こう思う理由は、「Twitterユーザーのデータは、そもそも人が見ても性別の判定が難しい」ため。 Twitterユーザー性別判定の手順 手順1〜5にはRuby、手順6にはPythonを使っている。 プロフィールに含まれる単語をリストアップする 各単語の出現回数を記録する 極端に出現回数が少ない、もしくは多すぎる単語は除去する 単語数を次元数とみなしてユーザーの