タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

ginzaとdlに関するincepのブックマーク (1)

  • はじめての自然言語処理 OSS によるテキストマイニング | オブジェクトの広場

    前回はグラフベースのキーフレーズ抽出手法と pke での実験結果を紹介しました。今回は、spaCy, scattertext, ... 等々の OSS を用い各種のテキストマイニング手法についてコード例とサンプルプロットを交えながら説明したいと思います。 1. はじめに 記事ではテキストマイニングの概要と代表的な手法について、コード例とサンプルプロットを交えて説明します。分析対象には、この連載で何度か用いている livedoor ニュースコーパスを用い、Google Colaboratory で動かすことを想定したコードスニペットを入れていきますので、実際に動かしたり対象を変えてみたりして試して頂けると良いかと思います。 2. テキストマイニングとは テキストマイニングとは、ざっくり言うと「自然言語の文書データを対象に使用される単語の出現傾向等を分析して何らかの有益な情報を取り出すこと」

    はじめての自然言語処理 OSS によるテキストマイニング | オブジェクトの広場
    incep
    incep 2022/07/26
    “ginza.STOP_WORDS”
  • 1