はじめに 欅坂46メンバの公式ブログを解析し、メンバ間の関係を抽出して相関図を作成しました。 データの収集から解析まで、基本的にPythonです。コードも公開してます。 趣味爆発の記事ですが、欅坂46分からなくても(たぶん)楽しめるよ! 解析方法 以下の4つの手順で解析しました。 1. ブログを収集 2. 各メンバのブログ文章から他メンバへの言及を抽出 3. 全ブログから言及関係数を集計 4. 関係を可視化 こちらの解析のコードにGitHubにupしており、以下URLで確認可能です。(ちょっと違うかもですが) github.com 1. ブログを収集 公式サイトからスクレイピングすることにより取得 収集方法はこちらの記事の通りです。 qiita.com 今回は漢字欅メンバ(卒業メンバを除く18名)の記事のみを対象としました。 総記事数は9196件 収集した記事の一部です。(Pandas D
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く