samurairodeoのブックマーク - はてなブックマーク

推定量の良し悪し：不偏分散を例に - HELLO CYBERNETICS

はじめに不偏性推定量不偏推定量不偏性を有さない推定正規分布の分散の推定不偏推定量は必ずしも良い推定量ではないバリアンスバイアスとバリアンス両者を考慮した平均二乗誤差正規分布の不偏分散と標本分散の比較はじめについ最近、統計を用いた分析の講義的なものを聴きました。統計分析は目的に応じて手法を適宜使い分けなければなりません。その講義では、分散の計算には標本分散ではなく不偏分散を使いましょうという具合の話がありました。きっとその分野では不偏分散を扱ったほうが良い分析ができるということなのでしょう。ところが、多くの人は単にそれを鵜呑みにしているだけだったりしないでしょうか。不偏分散がなぜ良いのか、あるいは本当に良いのであろうか、ということは一考の余地があります。今回は推定量の良し悪しの基準の1つである不偏性について説明し、分散の推定を例にその不偏性をもたらす推定が必ずし

samurairodeo 2023/07/08

あとで読む

リンク

評価指標入門の感想 - HELLO CYBERNETICS

はじめに誰向けか顧客や自身の部下などにデータサイエンスを説明をしなければならない立場の人機械学習のアルゴリズムには詳しいけどビジネス貢献ってどうやってやるの？という人データサイエンスのプロジェクトを管理する人機械学習やデータサイエンスをこれから始める人感想はじめに下記の書籍を以前（結構時間が経ってしまいました）高柳さんから頂いていましたので感想を書きたいと思います。評価指標入門〜データサイエンスとビジネスをつなぐ架け橋作者:高柳慎一,長田怜士技術評論社Amazon 遅くなった言い訳としては、「個人としては多くの内容が既知であったこと」が挙げられるのですが、この書籍に書かれている内容が未知であるかあやふやな人にとっては当然非常に有用になっています。そして、何よりもその伝え方（書かれ方）が今になって素晴らしいと実感できたためこのタイミングで書くこととしました。誰向けか

samurairodeo 2023/06/05

あとで読む

リンク

（データを扱う）ビジネスマン全てにおすすめの本 - HELLO CYBERNETICS

はじめにデータ分析：実用系 Kaggleで勝つデータ分析の技術ウェブ最適化ではじめる機械学習データ分析：因果推論入門統計的因果推論計量経済学大人の教養世界標準の経営理論科学的に正しい筋トレ最強の教科書落合務のパーフェクトレシピはじめに今回は、特にドメインを指定せず、読むと間違いなく誰にでも勉強になるであろうと感じた書籍を紹介します。データ分析：実用系 Kaggleで勝つデータ分析の技術 Kaggleで勝つデータ分析の技術作者:門脇大輔,阪田隆司,保坂桂佑,平松雄司発売日: 2019/10/09メディア: 単行本（ソフトカバー） "Kaggleで勝つ"と題名にはありますが、データ分析、特に予測モデルを作るようなケースで重要な基礎知識が実践的に学ぶことができる非常に良い本となっています。例えば、交差検証といえば、基本的には汎化誤差の推定量として統計学の本に

samurairodeo 2021/03/09

あとで読む

リンク

NumPyroの基本を変化点検知で見る - HELLO CYBERNETICS

はじめに NumPyro基本ライブラリの準備確率分布 transoforms モジュール（tfp.bijector相当）変化点検知データモデル事前分布からのサンプリングでモデルの動作確認 MCMC推論結果確認はじめに TFUGベイズ分科会にてPPLについて話しました。改めてPPLを複数比較してみたことで、一層NumPyrpの書きやすさにほれぼれとしました。 www.hellocybernetics.tech 現状、PPLをまとめると通常利用：Stan より低レベルを触れる研究用途：TensorFlow Probability 深層生成モデル及びベイズニューラルネットの変分推論 : Pyro 上記及び高速なMCMC : NumPyro という具合です。実際、速度やインターフェースの書きやすさを見るとNumPyroが個人的には抜けているのですが、一方でバックエンドがJaxで

samurairodeo 2020/09/30

あとで読む

リンク

TensorFlow User Group ベイズ分科会の資料 PPLについて - HELLO CYBERNETICS

はじめにはじめに作って遊ぶ機械学習。　の須山さんにお誘いを受け、TensorFlow User Group（通称TFUG）でPPLについてお話をしました。その資料へのリンクを貼っておきます。また、今後もこの動向について興味がある方はぜひconnpassのTFUGにもご参加ください。 tfug-tokyo.connpass.com speakerdeck.com

samurairodeo 2020/09/09

リンク

ベイズ統計 - HELLO CYBERNETICS

はじめにデータとモデル確率モデル確率モデルを作る複雑なモデルを使うことが最善手であるかモデルの具体的な作り方モデルの仮定アンサンブルモデル点推定モデル最尤推定制約付き最尤推定※ （最大事後確率推定）ベイズ予測分布と点推定ベイズ統計学ベイズ予測分布を得ることの意義ベイズ統計学の主題特異モデルと正則モデルベイズ統計学のまとめはじめにベイズだの頻度論だので盛り上がっているので、ぶん殴られる覚悟で書いてみます。データとモデル観測値がランダムに見える場合、それを確率変数 $X$ として扱います。さて、今、$X$ には我々が知ることのできない真の分布 $q(X)$ があるとしましょう。もしも、$X$ を無限回観測し満遍なくデータを集められるとすれば、$q(X)$ の形状を把握することができるかもしれません。ところが、そんなのは幻想であって実際に無限回の観測を

samurairodeo 2020/02/09

あとで読む

リンク

TensorFlow 2.0 のコードの書き方基本集（PyTorchとの比較） - HELLO CYBERNETICS

はじめに線形回帰と学習のコードデータセット PyTorch TF2.0 違い些細な違い：層の定義の仕方些細な違い：ロス関数の書き方大きな違い：勾配計算とパラメータ更新ニューラルネットワークの簡単な書き方 PyTorch TF2.0 違い畳み込みニューラルネットワーク PyTorch TF2.0 違いパディング畳み込み層→線形層 traininigフラグ RNN PyTorch TF2.0 違い大きな違い：多層化些細な違い：Bidirectional 大きな違い：戻り値の並び学習はじめに最近KerasからPyTorchに流れていく人たちが多く見受けられます。その中でて「Kerasで書いていたコードをPyTorchのコードで実装するにはどうすれば良いんだろう？」という声があります。要は、今まで使っていたフレームワークでやろうとしていたことを、別のフレームワークでやろ

samurairodeo 2019/01/28

あとで読む

リンク

TensorFlow2.0 Preview版が出ました！ - HELLO CYBERNETICS

TensorFlow 2.0発表！コード周辺の変更 tutorial TensorFlow 2.0発表！ついに動きがありましたね。APIは下記で見ることが出来ます。名前空間がスッキリしていることに気づくはずです。 www.tensorflow.org v1.12.0からv2.0へコードを書き換えるためのツールも整備されていく模様です。 tensorflow/tensorflow/tools/compatibility at master · tensorflow/tensorflow · GitHub また、2.0の発表して間もなく、githubにはチュートリアルのリポジトリが出現しました。さすがは注目度が高いですね。 github.com コード周辺の変更さて、TensorFlow2.0でどのように書き方が変わったのかというと、以前からお伝えしてきたとおり、Eagerをデフォルトと

samurairodeo 2019/01/14

あとで読む

リンク

ディープラーニングのハイパーパラメータ自動調整の概要 - HELLO CYBERNETICS

はじめにハイパーパラメータ自動調整の概要学習という関数グリッドサーチ関数近似器（ガウス過程）による方法メタヒューリスティック最適化強化学習まとめライブラリはじめにディープラーニングのハイパーパラメータ調整がとんでもなく退屈なことは周知の事実（？）です。一度学習を回すとその経過が気になってログを眺めてしまう人も多いのではないでしょうか。どうも望みがなさそうならさっさと次の値を試したいという思いもあることでしょう。そして、なるべく数を打ちながら良さげなハイパーパラメータの範囲を早く絞り込みたいと思うのではないでしょうか。こういうこと自体を上手く自動化するような試みが欲しくなります。古典的な方法ではグリッドサーチで、とにかく考えうるパターン全部試してやれ！というものがあります。しかしこの方法はディープラーニングのように一回の学習に時間が掛かる場合には有効ではありません。今

samurairodeo 2018/12/26

あとで読む

リンク

TensorFlow Probabilityでガウシアンプロセス回帰の最尤推定を実行してみる - HELLO CYBERNETICS

はじめにガウシアンプロセスで最低限知ってほしいこと線形回帰ガウシアンプロセス回帰ガウシアンプロセス回帰のまとめガウシアンプロセス回帰の推定まとめ１．ガウシアンプロセスのモデル２．推定するべきガウシアンプロセスのパラメータ３．カーネル関数でガウシアンプロセスのパラメータを書き換える４．推定すべきパラメータをすり替える補足 TensorFlow Probabilityで実践必要なライブラリのインポートでたらめなガウシアンプロセス回帰データの準備パラメータをフィッティングしていないガウシアンプロセス回帰のサンプリング学習したガウシアンプロセス回帰データ点準備ガウシアンプロセスのモデル構築損失関数の設定ガウシアンプロセス回帰のサンプラーいざ学習！更に進むためにはじめに TensorFlow Probabilityには様々な確率分布が実装されています。

samurairodeo 2018/11/08

リンク

確率的プログラミング言語 TensorFlow Probability【高レベルAPI、`tfp.glm`の紹介】 - HELLO CYBERNETICS

はじめに APIの全体像 Layer 0 : TensorFlow Layer 1 : Statistical Building Blocks Layer 2 : Model Building Layer 3 : Inference techniques Layer 4 : Pre-built models + inference 高レベルAPItfp.glmの紹介提供されている一般化線形モデル（GLM） ●class Bernoulli ●class BernoulliNormalCDF ●class Poisson ●class PoissonSoftplus ●class Normal ●class NormalReciprocal ●class LogNormal ●class LogNormalSoftplus ●class GammaExp ●class GammaSoftp

samurairodeo 2018/10/31

あとで読む

リンク

大幅に進化するらしいTensorFlow2.0について - HELLO CYBERNETICS

はじめに TensorFlow2.0がもうすぐ来るよ！ APIs High level APIs Eager Exexution Reference Models Contribの扱いプラットフォーム TensorFlow Lite TensorFlow.js TensorFlow with Swift パフォーマンス Distributed TensorFlow CPU、GPU、TPUの最適化関連その他のパッケージ TensorFlow Probability Tensor2Tensor End to End ML systems TensorFlow Hub TensorFlow Extended はじめに TensorFlow2.0ではこれまでのTensorFlowから大幅に変化するので、その変更点について記しておきます。基本的には公式のRoadmapの和訳と思って差し支えあり

samurairodeo 2018/09/20

あとで読む

リンク

【Python】最低限抑えておきたいループの書き方 - HELLO CYBERNETICS

はじめに while文 while文での基本的なループの書き方 while文をbreakで止める continueで１回ループをスキップするループが最後まで到達して終了したときにのみ処理を行う for文 for文での基本的なループの書き方 for文の基本はfor 変数 in イテレータ: 再び基本のforループへ要素の番号と要素をセットで取り出したいenumerate()関数２つのリストから順次同時に取り出す辞書のkeyとvalueを取り出すはじめにプログラミングというのは同じことを実現するにしても色々な書き方があります。ではそれらすべての書き方を網羅していなければならないかと言われるとそうでもなく、むしろ同じ処理の書き方が何通りもあるのならば、「効率の良い、読みやすい書き方」を１つ覚えておくことが重要だと思われます。今回は初心者が抑えておくと良いループの書き方を列挙して

samurairodeo 2018/09/17

あとで読む

リンク

機械学習の分野別概要【ディープ〜ベイズ】 - HELLO CYBERNETICS

はじめにディープラーニング概要方法論ツール伝統的機械学習概要方法論ツールベイズ機械学習概要方法論ツール最後にはじめに今回は機械学習のいろいろな分野（便宜的に分けているだけですが）についてそれぞれ概要とツールをまとめておきたいと思います。具体的には以下の３つに分けて書いています。ディープラーニング伝統的機械学習ベイズ機械学習注意点として、これらは本来別々に完全に分けて考えるものでもなく、混ぜて使うことができたり、あるいは理論的背景を共有していたりするものです。しかし、現状多くの場面ではこれらは用途に応じて使い分けられているのが実体であるため、あくまで使う側の立場でこれらの概要とツールについて述べていきます。ディープラーニング概要ディープラーニングは言わずと知れた、機械学習の大流行の引き金となった存在です。ディープラーニングのメインとなる存在である

samurairodeo 2018/08/09

リンク

はてなブックマーク

タグ

ブックマーク / www.hellocybernetics.tech (14)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス