Obey Your MATHEMATICS.[B!]新着記事・評価

BigDL + Apache Spark on EMR 5.8 でお手軽分散学習 - Obey Your MATHEMATICS.

7 users

mathetake.hatenablog.com

こんにちは。例のごとく久しぶりの投稿になってしまいました。前回投稿からいろいろな事がありました。 db analytics showcase Sapporo 2017 で講演してきたりベイズ統計の数理と深層学習 @db analytics showcase Sapporo 2017 from Takeshi Yoneda www.slideshare.net 雑誌に激エモポエムを寄稿したり YANSに参加してきたり gunosiru.gunosy.co.jp テキストアナリティクス・シンポジウムで発表してきたり data.gunosy.io もう少しで新卒で入社して半年が過ぎるわけですが、今振り返ると本当に刺激的な日々でした。近いうちに書籍の執筆もするっぽいです。この調子で突っ走りたいと思います。さて、前置きはこれくらいにして今日の題材は BigDL + Spark on EMR

テクノロジー
2017/09/22 19:00

EdwardによるDeep Beta Distribution(深層ベータ分布)モデル - Obey Your MATHEMATICS.

45 users

mathetake.hatenablog.com

こんにちは。お久しぶりの投稿です。来週末に開催される db analytics show case Sapporo www.db-tech-showcase.com と言うイベントで講演する事になってまして、ベイズ統計やMCMCの基本的なところからEdwardのデモまでやっていく予定なのですがただ基本的なモデルを紹介するのもおもしろくないので、僕なりの新しい深層学習＋確率モデリングなモデルを考えましたので紹介したいと思います。 EdwardやMCMCの基本的なところについては弊社のブログに寄稿した以下の記事が詳しいので合わせてそちらも御覧ください↓ data.gunosy.io §1. お気持ち例えば、ユーザーが付ける商品のレーティングを予測したいと考えます。これは通常ターゲットが閉区間に値を取る回帰問題として定式化されます。*1 与えられた特徴量に対して、予測値を出力するわ

テクノロジー
2017/06/24 14:29

ただの微分幾何学徒だった僕がデータサイエンスを何故/どのように勉強したのか - Obey Your MATHEMATICS.

565 users

mathetake.hatenablog.com

こんにちは。久々の投稿です。僕のTwitterをフォローしてくれている方はご存知かと思いますが、4月から機械学習エンジニア/データサイエンティスト(見習い)として働く事が決まりました。今日六本木の某社から正式に内定を頂きましたが、間違いなくTwitterのおかげでありTwitterこそ就活の全てであると確信した次第でございます— マスタケ (@MATHETAKE) 2017年2月23日良い区切りですので今回はタイトルの通り、ただの純粋数学の学生だった僕がデータサイエンスの勉強を何故/どのようにしてきたのか、についての思い出せる範囲で書こうと思います。 Disclaimer: この記事は基本的に、"What I did" に関する記事であって決して "What you should do" についての記事ではありません。そんな勉強方法おかしいとか、こうすべきだ、みたいなマサカリは一切受

テクノロジー
2017/02/26 19:11

EdwardでBayesian DNN＋Variational Inferenceをやってみた話 - Obey Your MATHEMATICS.

30 users

mathetake.hatenablog.com

こんにちは。今（僕の中で）話題沸騰中のベイズ統計用Pythonライブラリ Edward GitHub - blei-lab/edward: A library for probabilistic modeling, inference, and criticism. Deep generative models, variational inference. Runs on TensorFlow. を使って Bayesian DNN ＆ Variational Inference をやってみましたので、その報告＆コードの簡単な解説＆感想をこの記事では残しておこうと思います。前回の記事 mathetake.hatenablog.com で用意したHiggs粒子データセットを使って、分類器を作ろうと思います. ※Edwardってなんぞやって人は、公式Webまたは次の論文 [1701.037

テクノロジー
2017/01/19 13:53

Reproducing Kernel Hilbert Spaceの数理とMercerの定理 - Obey Your MATHEMATICS.

4 users

mathetake.hatenablog.com

こんにちは。この記事は、皆さんサポートベクトルマシン(SVM)でお馴染みであろう Reproducing Kernel Hilbert Space (再生核ヒルベルト空間) : (以下RKHS) に関するただの個人的なメモです。動機は、非常に重用なMercerの定理の証明がウェブ上で簡単に見つからなかったために色々調べてたものを整理する事です。個人的に、RKHS周りの数理を整理しておきたかった、と言うのもあります。 ※一応、ヒルベルト空間とその有界作用素の定義ぐらい知っていれば読めるようにリファレンスはなるべく付けてありますが、どう考えてもself-containedな記事ではありません。 §1. RHKSの定義とカーネルの関係を任意の空でない集合とします。定義(Reproducing Kernel Hilbert Space) 上の関数から成る実ヒルベルト空間が上のRepr

テクノロジー
2016/12/30 22:32

”ANNの内部状態はその出力関数から一意的に決まるのか”と言う問題の驚くべき解答 - Obey Your MATHEMATICS.

3 users

mathetake.hatenablog.com

こんにちは。タイトルの意味ですが、人工ニューラルネットワークの１. 隠れ層の数２.各層のニューロンの数３.重み４.バイアスこの４つは出力関数だけを見れば決まるのか？と言うものです。実はこの問題、特異点の解消の観点から、非常に重要(少なくとも従来の統計理論上)な問題なんですが、現在一般的に使われるような何十にもなる多層ネットワークに関しては全くの手付かずの状態でした。どんだけ調べても3層のネットワークの場合しか調べられていない。そんなモチベーションがあってここ一週間僕がずっと過去の結果[1,2,3]を拡張しようとしていたわけですが。。。 (部分的には拡張出来ましたが、壁にぶち当たっていました。) ですが実は今日、それに関連する(個人的に)驚くべき結果を見つけたため、共有します。その論文は C. Fefferman ,Reconstructing a neural

テクノロジー
2016/12/28 13:18

損失関数はそれほど複雑な関数ではないのかも？と言う話 - Obey Your MATHEMATICS.

13 users

mathetake.hatenablog.com

前回の記事 mathetake.hatenablog.com にある論文(2-2-9)[1605.07110] Deep Learning without Poor Local Minimaについてのお話です*1。 Abstractを読んだ瞬間に、こんな重要な論文をどうして今まで知らなかったのかと言うぐらい興奮しました。少し長いですが引用しますと In this paper, we prove a conjecture published in 1989 and also partially address an open problem announced at the Conference on Learning Theory (COLT) 2015. With no unrealistic assumption, we first prove the following state

テクノロジー
2016/12/22 08:53

deep learning

Deep Learningの理論的論文リスト - Obey Your MATHEMATICS.

123 users

mathetake.hatenablog.com

§1はじめに Deep Learningってどのくらい理論的に解明されているのか？ってやっぱり気になりますよね。それに関して、次のQuoraのスレッドに非常に有益なコメントがあります。 When will we see a theoretical background and mathematical foundation for deep learning? - Quora How far along are we in the understanding of why deep learning works? - Quora 深層学習界の大御所であるYoshua Bengio、Yann LeCunの二人が実際ディープラーニングの理論的理解ってどうなのよ？？って質問に直々にコメントしています。 LeCunのコメントの冒頭を少し引用しますと; That’s a very active

テクノロジー
2016/12/20 09:29

Taking the Human Out of the Loop -ベイズ最適化のすゝめ- - Obey Your MATHEMATICS.

12 users

mathetake.hatenablog.com

こんにちは。タイトルは次の論文から拝借しました; Taking the Human Out of the Loop: A Review of Bayesian Optimization - IEEE Xplore Document という訳で今話題沸騰中(？？？？？？？？)の Bayesian Optimization(ベイズ最適化)についてまとめたいと思います。また、日本語で「ベイズ最適化」とググるといくつか良い記事が見つかるのでそちらも合わせて参照してみて下さい。いくつかピックアップして、この記事の下の方に”参考記事”としてまとめておきました。また、佐藤一誠さんの講演動画も導入としてかなり参考になると思います。20分程度なので是非！ www.youtube.com しっかりと数学的なセッティングについて言及した記事があまりないように思われたので、そこにフォーカスして書きたいと思いま

テクノロジー
2016/12/19 15:39

ML

何故DeepNeuralNetworkの学習は難しいのか:特異点と対称性の視点から: Chapter 1 - Obey Your MATHEMATICS.

7 users

mathetake.hatenablog.com

こんにちは。今回はInformation Geometryの話ではありません。笑ネット上、そして市販されている書籍、どこを覗いても Deep Neural Network (以下DNN)の学習やその各種パラメータ調節は難しい、と言う事実は語っていてもどうして難しいのかまで踏み込んで説明してる文章は少ないように思われます。そしてとんでもなくヒューリスティックが多い。多い。うざいぐらい多い。ですので今回のシリーズでは、特異モデルと呼ばれる統計モデル視点と特異点と群作用と言う幾何学的な視点からどうしてDNNの学習が難しいのかそしてどうしてDNNの理論的理解が乏しいのかを説明したいと思います。巷に転がっている文章の用に ※※ふわっと解説はしませんので※※ 少々数学的に高度な話になりますが、頑張って噛み砕いて書くので、ついてきてください。いきなりDNNの話に入る前に、

テクノロジー
2016/11/16 21:23