xiangzeのブックマーク - はてなブックマーク

状態空間トピックモデルによる小説の可視化 - 廿TT

xiangze 2020/04/12

リンク

Juliaの自動微分を使ってより自由なFactorization Machines - 廿TT

Factorization Machines の解説はこの記事がわかりやすかった：一歩Matrix Factorization、二歩Factorization Machines、三歩Field-aware Factorization Machines…『分解、三段突き！！』 - F@N Ad-Tech Blog ただ Factorization Machines を動かすだけならモデルの提案者が公開しているlibFMとかを使ったほうが速い： libFMexeを動かすまで (R Wrapper for the libFM Executable参照記事) - Qiita でも統計キッズたちは観測モデルをポアソン分布にしたりとかしたくなるときがあるはず。（今回のモデルは R と Stan で Factorization Machines - 廿TT と同じです。） Stanだと時間がかかる。

xiangze 2019/12/21

リンク

変分ベイズによるトピックモデル（GaP; Gamma-Poisson Model）のパラメータ推定の高速化 - 廿TT

xiangze 2019/03/23

リンク

R と Stan で Factorization Machines - 廿TT

Factorization Machines の解説はこの記事がわかりやすかった：一歩Matrix Factorization、二歩Factorization Machines、三歩Field-aware Factorization Machines…『分解、三段突き！！』 - F@N Ad-Tech Blog Factorization Machines は傾向線に以下の式を仮定した回帰型のモデルである。ただしはドット積、を表す。例えばこんな感じの表が与えられたとき、 deviceCategory userGender userAgeBracket userType landingPagePath sessions desktop female 18-24 New Visitor /entry/2013/03/22/004017 11 desktop female 18-24

xiangze 2019/02/21

stan

リンク

ポアソン2状態隠れマルコフモデルの変分推論をRで - 廿TT

機械学習スタートアップシリーズベイズ推論による機械学習入門 (KS情報科学専門書) 作者: 須山敦志,杉山将出版社/メーカー: 講談社発売日: 2017/10/21メディア: 単行本（ソフトカバー）この商品を含むブログ (1件) を見る『ベイズ推論による機械学習入門』の例題です。説明抜きでコードだけ貼りますね。「完全分解変分推論」のほうはパラメータ推定が安定していなくて、初期値によって結果がだいぶかわってしまうようです。基本的には「構造化変分推論」を用いたほうが良さそう、計算時間はかかるけど。 softmax <- function(x){ maxx <- max(x) exp(x-maxx)/sum(exp(x-maxx)) } logp_x <-function(x,lambda,log lambda){ x*log lambda-lambda } logsumexp <- f

xiangze 2019/01/01

リンク

TensorFlowでSIRモデル（非定常ポアソン過程） - 廿TT

TensorFlowで統計モデリング - StatModeling Memorandum に感化されて、 SIR モデルと非定常ポアソン過程 - 廿TT と同じようなことをTensorFlowでもやってみました。 TensorFlowには常微分方程式を解く関数もあるようです。こんな感じです。 SIRのRを非定常ポアソン過程の強度関数として、パラメータ推定もやってみました。こんな感じです。全然関係ないけどIn All Likelihoodっていう本を買いました。冬休みはこれを読むんだ。 In All Likelihood: Statistical Modelling and Inference Using Likelihood (English Edition) 作者: Yudi Pawitan出版社/メーカー: OUP Oxford発売日: 2013/01/17メディア: Kindl

xiangze 2018/12/28

リンク

詩のリフレインを可視化するベイズモデル (rstan) - 廿TT

中原中也のサーカスという詩をたぶんあなたはすでにご存知だろう。幾時代かがありまして茶色い戦争ありました幾時代かがありまして冬は疾風（しっぷう）吹きました幾時代かがありまして今夜此処（ここ）での一（ひ）と殷盛（さか）り今夜此処での一と殷盛りサーカス小屋は高い梁（はり) そこに一つのブランコだ見えるともないブランコだ頭倒（あたまさか）さに手を垂れて汚れ木綿（もめん）の屋蓋（やね）のもとゆあーん　ゆよーん　ゆやゆよんそれの近くの白い灯（ひ）が安値（やす）いリボンと息を吐（は）き観客様はみな鰯（いわし) 咽喉（のんど）が鳴ります牡蠣殻（かきがら）とゆあーん　ゆよーん　ゆやゆよん屋外（やがい）は真ッ闇（くら）　闇の闇夜は劫々と更けまする落下傘奴（らっかがさめ）のノスタルジアとゆあーん　ゆよーん　ゆやゆよんサーカス: 中原中也・全詩アーカイブ「幾時代かがあり

xiangze 2018/10/24

リンク

グループドデータの非負値行列因子分解 - 廿TT

モチベーションたとえばこういう表がある。 gist.github.com 表の左のほうにユーザー層の情報、右の方にユーザー層ごとのブログへのアクセス経路が書かれている。どのユーザー層がどの経路を好むか知りたいとする。そこでトピックモデルとしてポアソン分布を使った非負値行列因子分解を考える。（トピックモデルシリーズ 6 GaP （Gamma-Poisson Model） - StatModeling Memorandum などを参照。）ユーザー層が文書、アクセス経路が単語に対応する。ユーザー層の情報を捨てて、行列を分解してしまうのはおもしろくない。ユーザー層の情報を説明変数として、ユーザー層ごとにトピックの構成が変わるようなモデルにしたい。モデル観測値を行列の積で近似することを目指します。 Y: 観測された分解したい行列(N行K列) X: 観測された説明変数(N行J列)

xiangze 2018/07/05

r
NMF

リンク

StanとRで最低賃金と失業率の関係を調べる - 廿TT

下記の内容について「先行研究も調べずにがさつな分析で結論を出すのはよくない」（引用は不正確）というようなコメントを頂戴し、そりゃそうだとおもったので最低賃金と雇用の関係について勉強になりそうな文献へのリンクをいくつか貼ります。 http://davidcard.berkeley.edu/papers/njmin-aer.pdf https://www.rieti.go.jp/jp/publications/dp/13j008.pdf https://www.socsci.uci.edu/~dneumark/IZA%20JLP.pdf http://www.jil.go.jp/institute/zassi/backnumber/2009/12/pdf/041-054.pdf 最低賃金はやはり低熟練労働者に悪影響を与える - himaginaryの日記以下の文章はあまり真に受けず他山の石と

xiangze 2018/02/25

リンク

時系列データで相関を出してはいけないのなら空間データでも相関を出してはいけないのではないか - 廿TT

以前にエクセルで無相関検定：失業率と野菜摂取量の相関 - 廿TT というエントリを書いた。めちゃくちゃ批判されるかと思ったけどそうでもなかった。じ、時系列データに対して単純な相関を算出している。。。 https://t.co/3yUB5ZEhRo— 統計たん@Rアイドル (@stattan) 2016年7月15日「時系列データに対して単純な相関を見るのは意味がない」というのはどうやら統計に詳しい人の間では常識なようです。なぜそうなるのかは正直よくわかっていないのですが、どうも自己相関のある系列どうしで相関係数を見ると、その系列どうしがまったく別々に動いていたとしても（両者がランダム・ウォークしていたとしても）、有意な相関や絶対値の大きい相関係数が得られやすいようです。だとすると、これは時系列データに限った話ではないはず。たとえば都道府県のデータだって隣り合う県どうしは影響しあ

xiangze 2018/02/24

リンク

［R+Google アナリティクス］リセンシーどこで切るチャート - 廿TT

アクセス解析の分野ではユーザーの離脱率や維持率を把握したいというニーズがあります。しかし、離脱するユーザーは単にサイトへの訪問を止めるだけで、わざわざ離脱を申告することはめったにありません。このような場合、例えば「3ヶ月訪問がなければ離脱したと判断する」などのルールを決めることがあります。この「離脱した」と判断する区切りは、3ヶ月がいいのか、2ヶ月がいいのか、4ヶ月がいいのか、難しいところです。その判断をサポートするために以下のようなグラフを書いてみてはいかがでしょうか。データセットを学習期間と評価期間に分ける閾値を定める学習期間で閾値を超えた日数訪問しなかったユーザーを「離脱」、それ以外を「維持」と判断維持と判断されたユーザーが、評価期間に再訪問があったユーザーの内、何パーセントかを数える（active）同様、維持と判断されたユーザーが、評価期間に再訪問がなかったユーザーの

xiangze 2018/02/11

リンク

［RStan］多項ロジスティックモデルで μ's とAqours の人気の差を調べる - 廿TT

xiangze 2017/06/24

stan

リンク

R: シニングによる非定常ポアソン過程のシミュレーション - 廿TT

xiangze 2017/05/24

リンク

{googleAnalyticsR} {ggplot2} 内訳をドリルダウンしていく棒グラフ - 廿TT

ggplot2 で左から右に内訳をドリルダウンしていく棒グラフ（ツリーマップ？）を書きました。新規訪問で自然検索経由のデスクトップを利用している男性の25歳〜34歳のCVが多いことがわかります。ついで再訪問でソーシャル経由訪問のモバイルを利用している男性の25歳〜34歳のCVが多いようです。 R のコードです。 library(googleAnalyticsR) library(cowplot) library(tidyr) library(dplyr) library(plyr) ga_auth() account_list <- ga_account_list() ga_id <- account_list[3,'viewId'] CVfilter <- filter_clause_ga4(list(met_filter("goal3Completions", "GREATER_T

xiangze 2017/05/09

ggplot2

リンク

［RStan］項目反応理論の応用でフリースタイルダンジョン登場ラッパーの強さをランキングしてみた - 廿TT

分析対象フリースタイルダンジョンはフリースタイル（即興）のラップバトルで、チャレンジャーがモンスターと呼ばれる強豪ラッパーを勝ち抜き、賞金獲得することを目指すテレビ番組です。データは、フリースタイルダンジョン結果勝敗全試合 - 戯言からもらいました。成形したデータは以下に置いておきます。 FSD.txt · GitHub Score1 がチャレンジャーのスコア、Score2 がモンスターのスコアです。ぼくは Web の知識がなさすぎてスクレイピングできないので、エディタでちまちま置換して成形しました。だれか rvest の使い方を教えてください。目的ラッパーの強さを表す素朴な方法として、スコアの平均を出すことが考えられます。しかし、これだと強い相手と当たった場合も、弱い相手と当たった場合も、スコアを同じ重みで評価することになります。また、順序尺度のデータを単純に

xiangze 2017/04/22

リンク

未知の変化点があるモデルでは AIC が使えない - 廿TT

モデル時系列データ () があるとします. このデータが, 変化点（）以前では平均 , 標準偏差 1 の正規分布に従い, 変化点から後には平均 , 標準偏差 1 の正規分布に従うと考えます. 標準偏差は既知とします. ここでは標準正規分布に従う確率変数です. 変化点を最尤推定するには, 対数尤度関数にが与えられたときの , の最尤推定量（標本平均）を代入して尤度が最大になる点を探してやればよさそうです. 最大化すべき対数尤度関数は以下です. ここでは標準偏差 1 の正規分布の密度関数, , です. R で推定乱数で適当なデータを作って, , , を推定してみます. , , , と設定しました. set.seed(1) x=c(rnorm(50,-1),rnorm(50,1)) #データの生成 ll1_f <- function(tau,n,x){ #尤度関数の定義 sum(dn

xiangze 2017/02/14

リンク

階層ベイズでもサンプルサイズを増やしたらベイズ信頼区間の幅は細くなってくれるのか - 廿TT

xiangze 2016/11/04

統計
stan

リンク

拡張カルマンフィルタによるロトカ・ヴォルテラ方程式へのデータ同化 - 廿TT

xiangze 2016/09/18

リンク

はじめまして★ - 廿TT

こんにちは～　牛です最近ブログのアクセス数が増えてきて、リアルのお知り合い以外の方も見てくれてるみたいでびっくりしております＞＜本当にありがとうございます(;_;) さてさてそういえば自己紹介してなかったなーなんて思いました!!! 最近まったく出会いがないなぁと思って、思い切ってはてなブログを始めました。よく癒し系と言われます。めっちゃ甘えたがりなので、ちゃんと受け止めてくれる人が好きです。一緒にいるときは、ずーっとくっついていたいです(*´艸｀*) ここで運命の人に出会えるかもなんて思ってる私は甘いのかな。。でも早く好きな人をひとりだけ見つけて退会したいです(;_;)/~~~ まずはメールから仲良くなれたら嬉しいです。よろしくお願いします(o(´∀｀)o)ﾜｸﾜｸ女の人からの連絡も歓迎ですよ〜笑血液型：B 星座：さそり座興味あること：恋人、結婚相手、ドライブ、お茶した