タグ

networkとPythonに関するAobeiのブックマーク (3)

  • Pythonを使って文章から共起ネットワークを作る 〜テキストマイニングでの可視化〜 - 見習いデータサイエンティストの隠れ家

    テキストから示唆を作り出すテキストマイニングの一つとして、今回は文章から共起ネットワークを作ります。共起ネットワークは、同時に出現する単語の組み合わせをエッジで繋ぎ、単語間の関係をネットワークで表したものです。これにより、文章内の単語の関連性を可視化できます。 今回は、Pythonの「networkx」を使って、共起ネットワークを実装します。今回の記事で最終的に出来上がった共起ネットワークは以下になりました。 今回の記事のコードはここに置いてあります。 データの準備 必要モジュールのインポート データの取得と加工 共起ネットワークのためのデータ整形 エッジの重みJaccard係数 Jaccard係数の分布 共起ネットワークの作成 終わりに データの準備 共起ネットワークを描くためには、テキストを文章を1区切りとして分割し、文章ごとに同時に出現する単語の組み合わせリストを作る必要があります。

    Pythonを使って文章から共起ネットワークを作る 〜テキストマイニングでの可視化〜 - 見習いデータサイエンティストの隠れ家
  • 3. Pythonによる自然言語処理 2-1. 共起ネットワーク - Qiita

    単語N-gramは、隣り合った単語の組をデータの単位とします。2-gram(2単語)であれば次のとおりです。 共起(co-location:コロケーション)は、対象とする単位(文)の中で単語が共に出現する回数をカウントします。 上記は名詞を対象に2単語とした例ですが、つまり相互の位置関係に関わらず、同一文中に出現する単語の組み合わせがデータの単位となります。 1. テキストデータの準備 ⑴ 各種モジュールのインポート re:Regular Expressionの略で、正規表現の操作をするためのモジュール zipfile:zipファイルを操作するためのモジュール urllib.request:インターネット上のリソースを取得するためのモジュール os.path:パス名を操作するためのモジュール glob:ファイルパス名を取得するためのモジュール ⑵ ファイルパスの取得 コーパスには、インター

    3. Pythonによる自然言語処理 2-1. 共起ネットワーク - Qiita
  • 【自然言語処理】【Python】共起ネットワークの作り方を理解する

    はじめに 自然言語処理をはじめたら、一度は作ってみたいのが共起ネットワークではないかと思います。 私自身、共起ネットワークについては、書籍やネット記事を参考にしながら、これまで何度も作ってきました。 しかしながら、文章→共起行列→共起ネットワークとなる一連の過程において、特に共起行列を作成するコードの理解が十分ではないと思い至り、今回、勉強もかねて、共起行列の作成過程を残すことにしました。 共起ネットワークに興味を持たれている方の参考になればと思います。 共起ネットワーク 単語どおしのつながりを可視化してくれる手法で、文章の構造的な特徴を直感的に理解するのによく利用されます。 文書(text)を文章(sentence)に分割したのち、同一文章中に同時に出現する単語(word)の組みを数えあげることで共起行列を作成し、これをネットワークで可視化します。 ネットワークはノード(丸) と、ノード

    【自然言語処理】【Python】共起ネットワークの作り方を理解する
  • 1