テキストから示唆を作り出すテキストマイニングの一つとして、今回は文章から共起ネットワークを作ります。共起ネットワークは、同時に出現する単語の組み合わせをエッジで繋ぎ、単語間の関係をネットワークで表したものです。これにより、文章内の単語の関連性を可視化できます。 今回は、Pythonの「networkx」を使って、共起ネットワークを実装します。今回の記事で最終的に出来上がった共起ネットワークは以下になりました。 今回の記事のコードはここに置いてあります。 データの準備 必要モジュールのインポート データの取得と加工 共起ネットワークのためのデータ整形 エッジの重みJaccard係数 Jaccard係数の分布 共起ネットワークの作成 終わりに データの準備 共起ネットワークを描くためには、テキストを文章を1区切りとして分割し、文章ごとに同時に出現する単語の組み合わせリストを作る必要があります。
