タグ

2016年12月1日のブックマーク (4件)

  • Word2Vecの進化形Doc2Vecで文章と文章の類似度を算出する - Qiita

    ■ doc2vec.pyをカスタマイズ 変更点① デフォルトのdoc2vec.pyだと、レスポンスのときのlabelがカスタマイズできなかったので、 設定したlabelで結果を呼び出せるように変更してみました。 変更点② doc2vec.pyのデフォルトでは、文書の似ているものは?って叩くと、文書も単語も出力されてしまうので、文書の似ている文書だけを出力するメソッドも作成しました。 #!/usr/bin/env python # -*- coding: utf-8 -*- # # Copyright (C) 2013 Radim Rehurek <me@radimrehurek.com> # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html """ Deep learning via the d

    Word2Vecの進化形Doc2Vecで文章と文章の類似度を算出する - Qiita
  • トピックモデルシリーズ 7 DTM (Dynamic Topic Model) の一種 - StatModeling Memorandum

    最後はおまけでLDAに時系列を組み合わせた実装を試してみたので紹介します。 今まで「文書」と呼んできたものを「ユーザー」、「単語」と呼んできたものを「アクセスしたWebページ(≒アクション)」と考えます。ユーザーが1日目~31日目までV種類のWebページにアクセスしたデータがあるとします。そしてユーザーの興味のあるトピックの分布(トピック混合比)が時間によって変化すると考えます。ある人は興味が移りやすく、またある人は移りにくいでしょう。そんな状況をモデリングします。 この記事の表記は以下です。1人あたり1時刻あたり150アクションぐらいというデータです(記事の最後にデータを生成したRコードを載せてあります)。 グラフィカルモデルは以下になります。 トピックごとの単語分布に比べて個々人のトピック混合比の方が移り変わるスピードが速いと考えられますので、今回は単語分布はどのタイムポイントでも同じ

    トピックモデルシリーズ 7 DTM (Dynamic Topic Model) の一種 - StatModeling Memorandum
  • トピックモデルを用いてWeb小説のジャンル・流行を分析しよう - #kichi-memo

    はじめに この記事は京大マイコンクラブ(KMC)の2012年度春合宿で発表したものを文章にまとめたものです.余談ですが,KMCはただいま絶賛新入部員募集中ですので,コンピュータ/プログラミング/DTM/イラスト制作に興味がある人は是非説明会でお越しください (宣伝). トピックモデルを用いてWeb小説のジャンル・流行を分析しよう from Seiichi KONDO 概要 皆さんは「小説家になろう」という小説投稿サイトをご存知でしょうか?そこそこライトノベルを読まれる方なら,一度ぐらい名前を聞いたことがあるのではないかと思います.と言うのも2010年頃から,「小説家になろう」発祥の小説が様々なライトノベルレーベルから発売されるようになったからです.有名どころですと「ログ・ホライズン」や「魔法科高校の劣等生」が挙げられるでしょうか. こうなるとラノベ読みとしては注目せざるを得ません.というわ

    トピックモデルを用いてWeb小説のジャンル・流行を分析しよう - #kichi-memo
  • Stan

    Stan is a state-of-the-art platform for statistical modeling and high-performance statistical computation. Many thousands of users rely on Stan for statistical modeling, data analysis, and prediction in the social, biological, and physical sciences, engineering, and business. Stan interfaces with the most popular data analysis languages (R, Python, shell, MATLAB, Julia, Stata) and runs on all majo

    Stan