白菜
都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト HDP(Hierarchical Dirichlet Process)いわゆる階層ディリクレ過程を実行できるモデルがPythonのGensimライブラリにあるという情報から、あまり実行例も見当たらないので、チャレンジしてみました。 HDP(Hierarchical Dirichlet Process) HDP(Hierarchical Dirichlet Process)は文書集合全体のトピック数と文書ごとのトピック数の推定を行うことができる手法で、中華料理店フランチ
はじめに Qiitaの記事をクロールしてLatent Dirichlet AllocationとHierarchical Dirichlet Process適用します。 モチベーション scrapy使ってみたかった gensimでいろいろやってみたかった 対象文書 対象とする文書は、Qiitaの記事にします。APIが整備されておりクロールしやすく、文書量もあります。 先行事例 本文も使うとかタグだけで行うとかいろいろあります。とても参考にさせていただきました。 Qiita「非エンジニア」記事をトピック分類(scikit-learnのLDAが重くldaで比較編) みなさん「いいね」は欲しいですか?Qiitaにて「いいね」を頂ける記事とは?を分析してみたよ LDAによるトピックモデル with gensim ~ Qiitaのタグからユーザーの嗜好を考える ~ ScrapingしてLDA写経 環
はじめに qiita記事にLDA・HDPを適用してみたの続き。 モチベーション 技術の時系列変化、例えば、AIとかコンテナとかの流行が見えるか見てみたかった。とはいえ、前回、トピック分類に若干失敗していたので、期待半分。 対象文書 前回の記事と同じくqiitaの記事です。 使ったライブラリ Dynamic Topic Modelsもgensimで利用できるのでこれを使います。 https://radimrehurek.com/gensim/models/wrappers/dtmmodel.html 参考記事 DTMについて トピックモデルシリーズ 7 DTM (Dynamic Topic Model) の一種 トピックモデルの応用: 関係データ、ネットワークデータ 驚異のアニヲタ社会復帰への道 DTM解析 gensimの利用方法について https://markroxor.github.i
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く