ideeeです。 エロデータサイエンティストを目指し、Pythonを勉強しています。 PythonでAVランキングトップ100から、単語の出現頻度を可視化してみました。 早速ですが、2012年のものがこちら 前にツイッターで流行ったやつですね 「AV」は当たり前ですが、「美少女」「人妻」「時間」が多いですね笑 Pythonで年間AVランキングのトップ100をスクレイピングし、 そのタイトルを形態素解析、WordCloudで可視化をしています。 2010年から2017年までを調べてみました。 *DMM.R18のサイトを参考にします。アダルト耐性がないかたはご遠慮下さい。 やること 前提知識 ①Selenium、Pandas、Janome、WordcCoudをインストール スクレイピング時に必要なライブラリ 形態素解析と可視化するときに必要なライブラリ ②AVランキングページからタイトルをスク