タグ

Qiitaとldaに関するni66lingのブックマーク (4)

  • 教師なしLDAから、半教師有りLDA(ガイド付きLDA)へ - Qiita

    教師有りLDAモデルを使って、何か面白いことができないか調べてみたいと思います。 今回は、そもそも日語での教師有りLDAモデルの解説記事が少なかったようなので、参考になったVikash Singh氏の英語版の記事の流れに沿って、半教師有りLDA(ガイド付きLDA)を解説していきたいと思います。 【元記事】 「How our startup switched from Unsupervised LDA to Semi-Supervised GuidedLDA」 LDA(トピックモデル)とは何か? ニュース記事のような文章を、「政治」「スポーツ」「科学」などのトピックに分けるモデルを、トピックモデルと呼びます。LDAはトピックモデルを構築するための手法の一つです。 以下で例を見ていきます。 この6つの文章を読み、以下のようにトピックに分類することは、人間にとっては難しくないはずです。 1.と

    教師なしLDAから、半教師有りLDA(ガイド付きLDA)へ - Qiita
  • LDAによるトピック解析 with Gensim - Qiita

    はじめに 今回は、Latent Dirichlet Allocation(潜在的ディリクレ配分法、以下「LDA」と略)と呼ばれるトピックモデルについて取り上げます。 特に記事では、LDA というトピックモデルを扱う上で押さえておくべき、トピックモデルやコーパスの概念に触れながら、前処理を含めた分析の流れやモデルの評価方法などについて、実装を通じて理解を深めていくことを目的とします。 また併せて、記事では、結果の可視化の手法についてもいくつか紹介したいと思います。 分析の流れとしては、ストップワードなどの文章の前処理の後、Gensim を用いて、文章をいくつかのトピックに分類していき、最後に WordCloud と pyLDAvis により結果の可視化を行っていきます。 目次 トピックモデルについて 分析環境と事前準備 モジュールの設定とデータのインポート 前処理 辞書とコーパスの作成

    LDAによるトピック解析 with Gensim - Qiita
  • Neural NetworkによるTopic Modelingとその実装 - Qiita

    この記事では、Neural Topic Modelingについて調べたことをまとめます。 個人的解釈が多少含まれる記事となっていますので、気になる点がありましたら記事へのコメントやTwitterでリプライをいただければと思います。 Twitter : @m3yrin TL;DR 従来の確率生成モデルとしてのトピックモデルに対して、Neural Topic Modeling(NTM)の強みを説明します。 PyTorchによってNTMの簡易な実装を行い、コードを公開します。 従来手法としてLDAでTopic Modelingを行い、NTMとの比較を行います。 トピックモデルとは トピックモデルは、文書集合で話題となっているトピックを、同じ文書で現れやすい語彙として抽出する手法です。 文書のメタ情報の抽出や、トピックを使って文書の分類に使用できます。 (岩田具治, トピックモデル 機械学習プロフ

    Neural NetworkによるTopic Modelingとその実装 - Qiita
  • ICML 2014 Best Paper斜め読み - Qiita

    LDA (Latent Dirichlet Allocation) ? とても分かりやすいLDAの紹介 Latent Dirichlet Allocation(LDA)を用いたニュース記事の分類 ICML 2014 Best PaperなLDAの論文 Understanding the Limiting Factors of Topic Modeling via Posterior Contraction Analysis ICML 2014 Awards Sponsored by Baidu 斜め読みした適当な意訳 Abstract LDAはよく知られた機械学習topic modelで、成功した応用例も沢山あるけれど、LDAの振る舞いを説明するきちんとした理論というものはほとんど無かったから、何がLDAの精度を左右するのかよく分からなかった。 そこで、この論文ではデータ増加に伴う収束性

    ICML 2014 Best Paper斜め読み - Qiita
  • 1