Fire and Motion[B!]新着記事・評価 - はてなブックマーク

Learning Latent Variable Gaussian Graphical Models (ICML2014)読んだ - Fire and Motion

4 users

harapon.hatenablog.com

MLaPPアドベントカレンダー12日目という下書きが下書きエントリにずっと入っていてそろそろ腐敗し始めているため，きまずくてブログが更新できない昨今です．MLaPPアドベントカレンダーは2年越しの計画という言い訳を思いついているので，今年の年末にがんばりたいですね…．さて，学生さんへの紹介用にICML2014のLearning Latent Variable Gaussian Graphical Modelsの説明スライドをつくったので，ブログにのっけておきます．細かい話は一切書いてないですが，そこらへんは論文を読んでください． Learning Latent Variable Gaussian Graphical Models from harapon ICML2014で面白そうだと思った論文は Joint Inference of Multiple Label Types in La

テクノロジー
2014/07/02 16:40

MLaPP アドベントカレンダー6日目：Ch.6 Frequentist statistics - Fire and Motion

4 users

harapon.hatenablog.com

というわけで，昨日はベイズ統計でしたが，本日は頻度論的統計の章です．頻度論から統計学を知った身としては，頻度論の問題点を指摘されているのは自分の黒歴史を見つめているようで悲しい気分になります…．とはいえ，最近は完全に発想がベイジアンになっているのですが．頻度論統計のベイズ統計の一番の視点の違いは最初にも書かれているように，頻度論はパラメータが固定（真のパラメータがある），データはそこからサンプリングされたに過ぎない（ランダムでありうる）と考えているのに対し，ベイズ統計はデータは固定（だって目の前にデータがあるじゃん！），パラメータはランダム（事前分布などに応じて変わりうる）と考えています．これらの違いを意識すると，どっちの立場の話もすっきりするのではないでしょうか． Sampling distribution of an estimator 頻度統計ではパラメータ推定値はestimato

テクノロジー
2013/12/06 13:09

機械学習

MLaPP アドベントカレンダー5日目：Ch.5 Bayesian statistics - Fire and Motion

3 users

harapon.hatenablog.com

5日目になってベイズ統計の章に入ってきました．ベイズの定理を用いたベイズモデリングや，そこまで詳しく触れられませんが古典的ベイズ，階層ベイズ，経験ベイズの違いがわかるといいと思います．また，次の章では頻度論的な話になっているので対比してみると理解が深まるように思います． Summarizing posterior distributions 事後分布は未知量に関して知っていること全てを要約 MAP estimation 未知量に対する点推定は事後分布の平均や中央値などで計算このアプローチは計算しやすいが，MAP推定には様々な欠点があることを把握しておくのは重要これは後半に続くより徹底的なベイズアプローチのモチベーションになっている No measure of uncertainty MAP推定を含む任意の点推定は不確実性に対する指標がない Plugging in the MAP est

テクノロジー
2013/12/05 07:06

機械学習

MLaPP アドベントカレンダー1日目：Ch.1 Introduction - Fire and Motion

14 users

harapon.hatenablog.com

12月ですね．そういえば昨年ベイズ統計分析ハンドブックに関するエントリーを書いたところ，ホッテントリに入って大量のアクセスを頂きましたが，誰一人としてアフィリエイトで買う人間はおらず，やはり薦める本を失敗した！と後悔し続けた2013年です．皆様から注目を頂いたベイズ統計ハンドブックですが，やはり1047ページ，28,000円という物理的にもお財布的にも鈍器のように優しくない本を購入する人間はいないということがわかったので，今年はもっとみんなが興味があり，かつ手に取りやすい本をご紹介したいと思います．そこで，MLaPPです．MLaPPとはMachine Learning: a Probabilistic Perspective（著者ページ）というタイトルで，全28章にわたって，Machine Learningを概説している本であり，PRMLと同じくらい注目されても良い本ではないかと個人的に

テクノロジー
2013/12/01 00:05

Contrastive Divergenceについてお勉強してみた - Fire and Motion

9 users

harapon.hatenablog.com

今週はMLど素人でありながら初めてIBISに参加し，様々な刺激を受けて大変良い1週間でした．いつもtwitter上でご活躍を拝見している方々とリアルに会ったり，遠目に眺めてみたり，話をしたりできたので良かったです．刺激を受けたご講演・発表は数多くあったのですが，Salakhutdinov先生（いまだに発音がわからない）の基調講演も面白い内容でした．Deep Learningが実装できるような計算機環境やデータを自分が準備できそうにないので，Deep Learning自体の進展については遠巻きにながめているしかないのですが，Restricted Boltzmann Machines (RBM)周辺の話は面白いなぁと素直に感じた次第です．現在，学生さんと自分の研究でGaussian Markov Random Fieldの欠損値推定をノリで行っているのですが，IBISに参加してRBM周辺のお

テクノロジー
2013/11/15 21:19

機械学習

Googleの人のオークション理論論文でも読んでみるその1 - Fire and Motion

62 users

harapon.hatenablog.com

Goel, G., Mirrokni, V. and Leme, R. P., Polyhedral Clinching Auctions and the Adwords Polytope, 44th ACM Symposium on Theory of Computing (STOC 2012). Google の2012年excellent paperが挙げられていて，その中にオークション理論の論文があった．Machine Learningと異なり，オークション理論，メカニズムデザインは自分の専門分野の一つなので，かいつまんで紹介してみる．あまり厳密な数学的記述は行わず，わかりやすさ重視で説明してみたい．まず，オークションに関する多くの誤解を解いておきたい．オークションというとある品物（財）を高く売りつける方法，または（ヤフオクのように）いらないものを処分する方法と実用上，捉えられが

テクノロジー
2013/06/17 09:34

Semi-Supervised Learning (Chapelle et al., 2006)のChapter 3読んだ - Fire and Motion

6 users

harapon.hatenablog.com

Semi-Supervised Text Classification Using EM Nigam, K., McCallum, A. and Mitchell, T. 私なんぞでも知っている有名人GoogleのNigamさんによるChapter 3 (pp.33-55)． McCallum, Mitchellも有名人．Tom MitchellはMachine Learningのテキストを1997年に出していますね．この章はテキスト分類にEMアルゴリズムを効率的に適用したもの．生成モデルを用いたテキスト分類には3つの重要なポイントがある．1つはシンプルな表現ではあるが，あるテキストのドメインでは生成モデルの確率と分類精度には正の相関があること，2つ目はあるドメインではこのような相関がないこと，3つ目はEMは局所最適に陥ることである． 1. Introduction EMアルゴリズムで欠損

テクノロジー
2013/06/05 16:12

機械学習

Semi-Supervised Learning (Chapelle et al., 2006)のChapter 2読んだ - Fire and Motion

3 users

harapon.hatenablog.com

A Taxonomy for Semi-Supervised Learning Methods Seeger, M. Ch 2(pp.15-31)もどちらかというとoverviewっぽい．半教師あり学習の分類について書かれている．相変わらず簡単なまとめメモ＋適当な意訳あり．あとはてダの数式が綺麗ではないので，少しがんばってみた．はてなブログの方が数式綺麗らしいので乗り換えようかなぁ…． 1. The Semi-Supervised Learning Problem 半教師あり学習には2つの基本的手法がある unlabeled dataを無視した教師あり分類問題 2. Paradigms for Semi-Supervised learning 半教師あり学習は教師あり学習のテクニックなので，当然生成モデル的アプローチと識別モデル的アプローチに分類できるこの節では統計学や機械学習でよく用い

テクノロジー
2013/05/27 13:48

Semi-Supervised Learning (Chapelle et al., 2006)のChapter 1読んだ - Fire and Motion

7 users

harapon.hatenablog.com

Chapelle et al. (2006)を買ったので読んでみてる．Zhu and Goldberg (2009)の"Introduction to Semi-Supervised Learning"も買った．後者はかなり薄いかつ簡単そうなので，概要を掴むには良さそう．まだ特に半教師ありを何かに適用するつもりではないのだけれど，勉強として1章(pp.1-12)を簡単に読んだのでまとめる． 1. Supervised, Unsupervised, and Semi-Supervised Learning Supervised and Unsupervised Learning 伝統的に教師あり学習と教師なし学習があるよ教師なし学習はを個の点の集合として各点は共通の分布からi.i.d.にドローされると仮定．行列を定義．教師なし学習の目的はデータの興味深い構造を見つけること教師あり学習

テクノロジー
2013/05/24 12:36

機械学習

指数型分布族とはなんぞ - Fire and Motion

20 users

harapon.hatenablog.com

皆さん，ご存じの指数型分布族(exponential family)について私の拙い理解をまとめておきたいと思います．指数型分布族といえば，難しめの統計学や機械学習の本を読んだときに突如出てきて，「え，何それ，指数分布じゃないの？僕，指数分布しか知らないよ−」と思っている読者を撲殺し，しかし，殺されている本人は「まぁ，たぶん指数分布みたいなものだろう，とりあえず読み進めよう」と見ない振りをしているアレです．えぇ．私もそういう理解です．しかし，このままではいかんので，そこらへんにあった文献を元に簡単な理解をまとめておきたいと思います．ちなみに私の初エンカウンターはPRMLでした．てか，（私が学んだゆるい）大学時代の講義ではこんなもの習わなかったのですが，この指数型分布族とはどういう統計の授業では学ぶモノなのでしょう…．単なる勉強不足かもしれませんが…．あいつもこいつも指数型分布族まず，P

テクノロジー
2013/05/14 16:31

Fire and Motion

4 users

harapon.hatenablog.com

すべてがFになる，映像化するみたいですね．犀川創平も西之園萌絵も配役がイメージと違って一部で話題になっていました．さて，最近テンソル分解を使った論文をよく見かけるのですが，いまだにきちんと整理できずにいます．テンソルかわいいよ，テンソル．そこで，まずは行列分解(matrix factorization, matrix decomposition)を整理してみようと思います．行列の分解手法というと線形代数的な観点からは簡単に思いつくだけでも固有値分解 LU分解コレスキー分解などがありますが，これらは分解前の行列と分解後の行列が一致する(たとえばA=LU)方法です．一方で，機械学習やデータマイニング界隈（特にレコメンデーション等）で出てくる行列分解というのは，大規模データや関係性データの中から低ランクの構造を抽出することや次元圧縮を目的としています．なので，正確に言うならば，行列分解と

テクノロジー
2012/12/01 00:18

東日本大震災ビッグデータWS project 311に参加するその7 - Fire and Motion

11 users

harapon.hatenablog.com

首都圏における帰宅困難者のモデリングその4 いろいろ空き時間をみつけてはhogehogeしております．さてさて，最終発表も近いですし，ここいらで今回のWSで提供されたデータの性質についてもう一度振り返っておきたいと思います．今回のWSのタイトルは"東日本大震災ビッグデータWS"です．それに対して，○○GB程度じゃビッグデータじゃないやんけ…などの揶揄が聞こえてきますが，そこを突っ込むのはやめておきましょう．WS用にデータを小さくしているだけですし．こんなこと，僕が言うまでもなく，皆さん気付いておられるはずですが，おそらく近年流行りのビッグデータというものはデータがビッグなことではなくて，(膨大な)ログデータということを言いたいのだと思います．今回提供されたデータはJCC, Twitter, 朝日新聞社, Google, ゼンリンデータコム, 本田技研工業, NHK, レスキューナウどの

テクノロジー
2012/10/25 21:27

東日本大震災ビッグデータWS project 311に参加するその4 - Fire and Motion

3 users

harapon.hatenablog.com

三日坊主で更新が止まってましたが，いろいろ試してはいたのです．位置情報付きのtweetリスト作成プロジェクト先週土曜日くらいからこういうことをやっていました．ただのデータ作成ではありますが，メンバーに恵まれて楽しく作業できました．@hiiragi1104 さん，@antlabo さん，@_kawaken_ さん，@y_benjo さん，ありがとうございました．これで地理情報付きツイートの分析が行えます．首都圏における帰宅難民のモデリング(仮) その1 @y_benjoさんとなんかやろうと見切り発車で始めました．プロジェクトページはこちら．平常時(3/08)と震災時(3/11)の人口分布の変動をメッシュではなく，等高線で表してみました．深夜0時から翌日午前7時までのgifにしています．都心部から人口が減らないこと，ターミナル駅に人が集中することが見て取ることができます．図をクリック

テクノロジー
2012/09/27 08:23

東日本大震災

東日本大震災ビッグデータWS project 311に参加するその2 - Fire and Motion

3 users

harapon.hatenablog.com

twitterによるURL共有情報の分析その2 昨日に引き続き，URL共有情報の分析を行う．データ概要は昨日参照．tweet内に含まれるURLの総数は28,601,436，unique数(種類)は名寄せ前で8,312,928．第一段階として，名寄せ前の出現頻度の多い上位500のみを対象として名寄せを行う．本当はすべての名寄せを行いたいが，pythonのurllib2.urlopen().geturl()を用いるとリクエストにどうしても時間がかかってしまい，処理時間が膨大になってしまうので，まずは上位500に絞って傾向を見ることで，分類軸を考えることにする．(名寄せの方法の良い方法なにかありませんかね…？昨日に突然，bit.lyさんからイケメンな提案がされていたので，bit.lyはそのデータとすりあわせればなんとかなるかもしれない．まだ見てないけど．) ※追記：というアドバイスを@jn

テクノロジー
2012/09/20 18:41

東日本大震災

東日本大震災ビッグデータWS project 311に参加するその１ - Fire and Motion

29 users

harapon.hatenablog.com

(2012/9/19 22:51追記 url切れが多かったは間違いだったので修正．奥村先生の分析結果と数が合わないのはもう一度チェックする！) (2012/9/20 14:24追記 1tweetに複数以上のurlが含まれていても1つしか抽出していなかったので修正．奥村先生の抽出結果の数字とほぼ同じオーダーの数値になったが，今度はこちらが10〜20程度多いものがある…なぜ…？) (2012/9/20 22:05追記奥村先生とのツイート数のずれはURLの後ろに付いた#が原因であることが判明．詳細は奥村先生のtwitter分析のページに記載されています） Googleが幹事となり，朝日新聞社，JCC，Twitter Japan，日本放送協会，本田技研工業，レスキューナウ，ゼンリンデータコムによる8社が2011年3月11日前後のデータを公開して，当時何が起こったのか，震災時に必要なサービスは何か

テクノロジー
2012/09/19 16:13

Big Tent 2012 -自然災害とIT活用に関する国際会議-に参加してきた - Fire and Motion

3 users

harapon.hatenablog.com

Googleが開催していたBig Tent 2012 -自然災害とIT活用に関する国際会議-に参加してきた．たぶん全体的な内容はGoogle自身によってblogで公開されたり，参加者によるblog報告やツイート，togetterあたりでまとめられるのではないかと思うので，ここでは割愛． - (追記)togetterにまとめられていましたね．しかし，ツイートだけで全体像を掴むのは厳しい…．Google or 有志によるblog報告が待たれる…． Big Tent Sendai summary of tweets #bigtentsendai - やはり自分の関心であるネットの情報とリアルをどのように繋ぐべきかという内容のディスカッションが行われた「ネットからリアルへ：救助・救援・復興まで、被災地における支援の計画と管理」についてまとめてみる．モデレータはMIT メディアラボの石井先生（初め

テクノロジー
2012/07/02 18:14

GDD2011 DevQuiz のスライドパズル晒し祭りをまとめてみた - Fire and Motion

41 users

harapon.hatenablog.com

基本的に自分用メモです．主に以下のtogetterまたは#gdd11jpのハッシュタグから情報を集めました．一応言語順にしてあります． http://togetter.com/li/187147 （勝手にリスト化してほしくないという場合はご連絡ください！）追記：エントリーポスト時は9名分．9月12日18時で16名分に増加．22時に28名分，9月13日10時現在43名分です．大雑把な分類でJava:14名，C++:8名，C:6名，C#:1名，Python:6名，Perl:3名，Ruby:1名，Haskell:1名，PHP:1名，Go:1名，OCaml:1名． @komiya_atsushi さん言語：Java コード置き場：https://code.google.com/p/k11i-gdd2011jp-slidepuzzle-solver/ 本人による解説：http://blog.k

テクノロジー
2011/09/12 14:36

Google Python ClassというGoogleによるPythonレクチャー - Fire and Motion

18 users

harapon.hatenablog.com

同じくPython関連で，Google Code Universityの中にPython Classがあることを見つけたのでメモ．GoogleはPythonユーザーが多いので，なんとも役に立ちそうな予感．一つ一つが1時間弱あるので全部見るのは時間がかかりそうだけど，ちまちまとチェックしよう． Introduction, strings Lists and sorting Dicts and files Regular expr Utilities Utilities urllib Conclusions 他にもデザインパターンに関するtech talkの動画などもあるので至れり尽くせりな感じ！

テクノロジー
2011/07/26 05:45

はてなブックマーク

はてなブックマーク

『Fire and Motion』

すべてがMFになる - Fire and Motion

Learning Latent Variable Gaussian Graphical Models (ICML2014)読んだ - Fire and Motion

MLaPP アドベントカレンダー6日目：Ch.6 Frequentist statistics - Fire and Motion

MLaPP アドベントカレンダー5日目：Ch.5 Bayesian statistics - Fire and Motion

MLaPP アドベントカレンダー1日目：Ch.1 Introduction - Fire and Motion

Contrastive Divergenceについてお勉強してみた - Fire and Motion

Googleの人のオークション理論論文でも読んでみるその1 - Fire and Motion

Semi-Supervised Learning (Chapelle et al., 2006)のChapter 3読んだ - Fire and Motion

Semi-Supervised Learning (Chapelle et al., 2006)のChapter 2読んだ - Fire and Motion

指数型分布族とはなんぞその2 - Fire and Motion

Semi-Supervised Learning (Chapelle et al., 2006)のChapter 1読んだ - Fire and Motion

Hierarchical Geographical Modeling of User Locations from Social Media Posts (WWW2013)を読んだ - Fire and Motion

指数型分布族とはなんぞ - Fire and Motion

ベイズ統計分析ハンドブックは神本！ - Fire and Motion

Fire and Motion

東日本大震災ビッグデータWS project 311に参加するその7 - Fire and Motion

東日本大震災ビッグデータWS project 311に参加するその4 - Fire and Motion

東日本大震災ビッグデータWS project 311に参加するその2 - Fire and Motion

東日本大震災ビッグデータWS project 311に参加するその１ - Fire and Motion

Big Tent 2012 -自然災害とIT活用に関する国際会議-に参加してきた - Fire and Motion

日本地図の色分け - Fire and Motion

GDD2011 DevQuiz のスライドパズル晒し祭りをまとめてみた - Fire and Motion

Google Python ClassというGoogleによるPythonレクチャー - Fire and Motion

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

『Fire and Motion』

このページはまだブックマークされていません

キーボードショートカット一覧

公式Twitter

はてなのサービス

このページはまだ
ブックマークされていません