ブックマーク / www.hellocybernetics.tech (37)

  • (データを扱う)ビジネスマン全てにおすすめの本 - HELLO CYBERNETICS

    はじめに データ分析:実用系 Kaggleで勝つデータ分析技術 ウェブ最適化ではじめる機械学習 データ分析:因果推論 入門 統計的因果推論 計量経済学 大人の教養 世界標準の経営理論 科学的に正しい筋トレ 最強の教科書 落合務のパーフェクトレシピ はじめに 今回は、特にドメインを指定せず、読むと間違いなく誰にでも勉強になるであろうと感じた書籍を紹介します。 データ分析:実用系 Kaggleで勝つデータ分析技術 Kaggleで勝つデータ分析技術 作者:門脇 大輔,阪田 隆司,保坂 桂佑,平松 雄司発売日: 2019/10/09メディア: 単行(ソフトカバー) "Kaggleで勝つ"と題名にはありますが、データ分析、特に予測モデルを作るようなケースで重要な基礎知識が実践的に学ぶことができる非常に良いとなっています。例えば、交差検証といえば、基的には汎化誤差の推定量として統計学の

    (データを扱う)ビジネスマン全てにおすすめの本 - HELLO CYBERNETICS
  • ベイズ統計 - HELLO CYBERNETICS

    はじめに データとモデル 確率モデル 確率モデルを作る 複雑なモデルを使うことが最善手であるか モデルの具体的な作り方 モデルの仮定 アンサンブルモデル 点推定モデル 最尤推定 制約付き最尤推定※ (最大事後確率推定) ベイズ予測分布と点推定 ベイズ統計学 ベイズ予測分布を得ることの意義 ベイズ統計学の主題 特異モデルと正則モデル ベイズ統計学のまとめ はじめに ベイズだの頻度論だので盛り上がっているので、ぶん殴られる覚悟で書いてみます。 データとモデル 観測値がランダムに見える場合、それを確率変数 $X$ として扱います。 さて、今、$X$ には我々が知ることのできない真の分布 $q(X)$ があるとしましょう。もしも、$X$ を無限回観測し満遍なくデータを集められるとすれば、$q(X)$ の形状を把握することができるかもしれません。 ところが、そんなのは幻想であって実際に無限回の観測を

    ベイズ統計 - HELLO CYBERNETICS
  • 強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

    はじめに ベルマン方程式の概要 最適制御と評価関数 最適制御 評価関数 価値関数 ベルマンの最適性原理 ベルマン方程式 価値関数の離散化 状態の時間発展再訪 ベルマン方程式 まとめ 最後に はじめに 強化学習の基礎に置かれている「ベルマン方程式」について、言葉は知っているが実はちゃんと理解していないという方は意外と多いのではないかと思われます。これを知っていようが知っていまいが、正直世の中の便利なフレームワークを活用すれば強化学習を実行することは可能であるためだと推測されます。 しかし、ある種の出発点になっているはずの基礎方程式を無視して、ガチャガチャ色々試してみても、なんだかフワついたままでモヤモヤしてしまうのではないでしょうか。少なくとも自分はそうです。 なので今回はベルマン方程式を基から丁寧に解説していきたいと思います。 ベルマン方程式の概要 細かい話をする前に、ベルマン方程式がど

    強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS
  • ディープラーニングは自動で特徴を抽出してくれる? - HELLO CYBERNETICS

    はじめに 特徴抽出とは ニューラルネットワークによる特徴抽出 深層学習は特徴抽出を自動で行うのか 補足:当に自動機械学習に向けて はじめに 未だに強く主張されることの多い「ディープラーニングは人手の特徴抽出作業を自動で実施してくれる」という話。 このことについては肯定も否定もしないというのが私の立場ですが、基的に「思っているより思い通りには行かない」という事実があることは主張しておきたいです。 そのために、今回「ディープラーニングが自動で特徴抽出を行ってくれる」ということがどういうことなのかを簡単に説明します。 特徴抽出とは まず特徴抽出とは何かを説明していきましょう。特に断りが無い限りは大文字は行列、小文字はベクトルあるいはスカラーだと思って差し支えありません(今回は特に細かい数式の設定が議論に影響することはありません)。 今、入力 $x$ で出力が $y$ となるような適当なデータ

    ディープラーニングは自動で特徴を抽出してくれる? - HELLO CYBERNETICS
  • 統計の勉強に最適な緑本こと「データ解析のための統計モデリング入門」を紹介 - HELLO CYBERNETICS

    はじめに データ解析のための統計モデリング入門 の構成に関する特徴 の内容に関する特徴 の目次と各章の概要 第1章 データを理解するために統計モデルを作る 第2章 確率分布と統計モデルの最尤推定 第3章 一般化線形モデル 第4章 GLMのモデル選択 第5章 GLMの尤度比検定と検定の非対称性 第6章 GLMの応用範囲を広げる 第7章 一般化線形混合モデル 第8章 マルコフ連鎖モンテカルロ法とベイズ統計モデル 第9章 GLMのベイズモデル化と事後分布の推定 第10章 階層ベイズモデル 第11章 空間相関のある階層ベイズモデル 対象読者 想定と違ったとなる前に こんな人に最適です はじめに 正直今更感が非常に強い一冊になります。 既によく知られているベストセラーと言ったところですが、例えば「自分はR使いではないからな」とか、その程度の理由で購入をためらっている人もいるかもしれません(現に

    統計の勉強に最適な緑本こと「データ解析のための統計モデリング入門」を紹介 - HELLO CYBERNETICS
  • 確率的プログラミング言語 TensorFlow Probability【高レベルAPI、`tfp.glm`の紹介】 - HELLO CYBERNETICS

    はじめに APIの全体像 Layer 0 : TensorFlow Layer 1 : Statistical Building Blocks Layer 2 : Model Building Layer 3 : Inference techniques Layer 4 : Pre-built models + inference 高レベルAPItfp.glmの紹介 提供されている一般化線形モデル(GLM) ●class Bernoulli ●class BernoulliNormalCDF ●class Poisson ●class PoissonSoftplus ●class Normal ●class NormalReciprocal ●class LogNormal ●class LogNormalSoftplus ●class GammaExp ●class GammaSoftp

    確率的プログラミング言語 TensorFlow Probability【高レベルAPI、`tfp.glm`の紹介】 - HELLO CYBERNETICS
  • 初級SE・プログラマーにぜひとも読んで欲しい厳選図書4冊 - HELLO CYBERNETICS

    はじめに オブジェクト指向でなぜつくるのか プリンシプルオブプログラミング リーダブルコード 6日間で楽しく学ぶLinuxコマンドライン入門 最後に はじめに 今回はSEやプログラマーなどのソフトウェアに関わる人に是非とも読んでおいて欲しいを紹介します。 もちろん職業としてのプログラマーでなくとも、ソフトウェアに趣味でもなんでも何らかの形で携わっている、携わりたいならば一読しておきたいものばかりです。 今まで独学でやってきたが、でしっかり基礎を固めたい これから勉強するつもりだがどうすればいいかわからない それなりに理解しているつもりだが、自分の理解を確認したい という場合にとってもおすすめです。 当は沢山のをオススメしたいのですが、たくさんありすぎても分からない!と思いますので4冊に絞ります。それぞれのプログラミング言語に関する詳しい知識などは別途鍛えていく必要がありますが、間違

    初級SE・プログラマーにぜひとも読んで欲しい厳選図書4冊 - HELLO CYBERNETICS
  • 【クラスタリングの新トレンド?】DeepClusterとその発展の考察 - HELLO CYBERNETICS

    はじめに クラスタリング 概要 K-means K-meansの改良 DeepClusterの基的アイデア 考察と今後の展開 一提案 はじめに 私は普段、Twitterを大いに活用して情報収集をしております。今回の記事のタイトルにある「DeepCluster」はtwitterのTLで流れてきた以下のarxivで提案されたクラスタリング手法です。 [1807.05520] Deep Clustering for Unsupervised Learning of Visual Features 今回はこの手法の基的な着眼点と、今後の発展について素人ながら考察してみます。 クラスタリング 概要 まずクラスタリングというものが、一体どんな問題設定であるのかをしっかりと認識しておきましょう。多次元のデータ$D = \{\mathbf x_1,...,\mathbf x_N \}$が手元にあるとし

    【クラスタリングの新トレンド?】DeepClusterとその発展の考察 - HELLO CYBERNETICS
  • 初学者が機械学習の勉強を進めるためには必ず手を動かす - HELLO CYBERNETICS

    機械学習に必要な知識 ネット上の様々な意見 機械学習への携わり方と必要な数学 具体的に勉強を進める 簡単な問題で動作を確認 プログラムを書く Kaggleはやるべき? 勉強を進める上で使えるツールたち Python Jupyter Notebook scikit-learn TensorFlow 機械学習に必要な知識 ネット上の様々な意見 機械学習の勉強をしていく上で大事なものは何でしょうか。 調べればプログラミングだとか統計だとか、解析学・線形代数学であるなど、いろいろな意見が見られます。 おそらくネット上で見つかるいろいろな意見、「機械学習では○○を勉強すべき」という話は、少なくともその話を言っている人の中では真であるのだろうと思われます。 要するに、その勉強をしたことによって(あるいはその知識を持っていたことによって)、その人は何らかの機械学習に対する知見が得られたと言っているのです

    初学者が機械学習の勉強を進めるためには必ず手を動かす - HELLO CYBERNETICS
  • Deep Learning勉強のための書籍【2018年版】 - HELLO CYBERNETICS

    はじめに 初級編 ゼロから作るDeep Learning 中級編 scikit-learnとTensorFlowによる実践機械学習 PythonとKerasによるディープラーニング 上級編 Pro Deep Learning with TensorFlow Deep Learning はじめに ディープラーニングに関する書籍は山ほど出てきています。 その中でどれを読めば良いのか分からない、というのは初心者にとって最初の問題でもあるでしょう。まずはブログなどのネットの情報を参考に勉強をする人が多いかと思われますが、私のブログも含め、大抵は個人の興味に沿ってバラバラに話題が提供されるため、できれば1つ1つ順を追って解説してくれる物が欲しいと感じるのが音と思われます。 今回は、数ある書籍の中でも私自身が所持していておすすめできるディープラーニングの書籍を載せたいと思います。 初級編 ゼロから作

    Deep Learning勉強のための書籍【2018年版】 - HELLO CYBERNETICS
  • 機械学習で予測モデルを作る際の概要のオレオレまとめ - HELLO CYBERNETICS

    はじめに 機械学習のモデル 教師あり学習 機械学習における予測モデルの基的な作り方 予測モデルfの考え方 $\phi(x)$の決め方 特徴量エンジニアリング モデル選択 ニューラルネットワーク 複数の予測モデルの活用 アンサンブル ベイズ予測分布 はじめに 機械学習のモデルには数多くのものが存在します。 例えばサポートベクターマシンやニューラルネットワーク、ロジスティック回帰モデルなど、初学者にとってどれが何のために生み出され、 そしてどのような時に有効なのかを把握することは難しいように思います。 そこで今回はある特定のモデルについて細かく見るのではなく、機械学習のモデルが何を表し何を達成しようとしているのかの概観を与え、 それぞれのモデルがどういう時に使えそうなのかの感覚を身につける手がかりのようなものを書いてみたいと思います。 (最初、一般化線形モデルからベイズまでそれなりにしっかり

    機械学習で予測モデルを作る際の概要のオレオレまとめ - HELLO CYBERNETICS
  • ディープラーニングのハイパーパラメータ自動調整の概要 - HELLO CYBERNETICS

    はじめに ハイパーパラメータ自動調整の概要 学習という関数 グリッドサーチ 関数近似器(ガウス過程)による方法 メタヒューリスティック最適化 強化学習 まとめ ライブラリ はじめに ディープラーニングのハイパーパラメータ調整がとんでもなく退屈なことは周知の事実(?)です。一度学習を回すとその経過が気になってログを眺めてしまう人も多いのではないでしょうか。どうも望みがなさそうならさっさと次の値を試したいという思いもあることでしょう。そして、なるべく数を打ちながら良さげなハイパーパラメータの範囲を早く絞り込みたいと思うのではないでしょうか。 こういうこと自体を上手く自動化するような試みが欲しくなります。古典的な方法ではグリッドサーチで、とにかく考えうるパターン全部試してやれ!というものがあります。しかしこの方法はディープラーニングのように一回の学習に時間が掛かる場合には有効ではありません。 今

    ディープラーニングのハイパーパラメータ自動調整の概要 - HELLO CYBERNETICS
  • 最適制御からの強化学習 - HELLO CYBERNETICS

    はじめに 最適制御 そもそも制御問題とは? 自動制御 フィードバック制御 制御問題の例 最適制御問題 最適制御のまとめ 最適制御から強化学習へ 最適制御の困難 強化学習の形式と最適制御との比較 環境の振る舞いを知る方法は無いのか 強化学習の大まかな流れ モンテカルロ法 TD法 関数近似 最後に 制御の分野と強化学習 基的思想の違い 実用的問題 PID制御という巨人 はじめに 強化学習といえば、最強の囲碁ソフトAlphaGo に搭載されているアルゴリズムで一躍有名となった分野です。今回は強化学習の特殊な問題設定がどういうものであるかを強調するため、最適制御としての立場から発展させた強化学習を見てみたいと思います。 最適制御 そもそも制御問題とは? 例えば、自動車の速度を調整する場合、タイヤの回転を調整する必要がありますが、私達が実際にやっているのはアクセルやブレーキを踏み込むことだけです。

    最適制御からの強化学習 - HELLO CYBERNETICS
  • 機械学習関連を取り扱うはてなブログを探してみた - HELLO CYBERNETICS

    はじめに 自然言語処理の深遠 作って遊ぶ機械学習木で働くデータサイエンティストのブログ 人工知能に関する断創録 数学、ときどき統計、ところによりIT 空飛ぶロボットのつくりかた はじめに ただの雑記。 専門書的な内容ではなく、機械学習に取り組む実際の姿が見られるブログを取り集めました。例えばコードが載っているとか、分かりやすい解説があるとか、その手の記事が書かれているものに焦点を絞っています。 自然言語処理の深遠 非常に実践的。 今のところは、あまり記事は多くありませんが、Kerasを使った機械学習による自然言語処理に関しての記事が積極的に書かれています。Kerasの実装に関して、コードで検証を行っていたり、実用面で参考になることが多いと思われます。 hironsan.hatenablog.com 特に自然言語処理だとChainerやPyTorchのようなDefine by Runの

    機械学習関連を取り扱うはてなブログを探してみた - HELLO CYBERNETICS
  • ディープラーニングの応用のための具体的方針まとめ - HELLO CYBERNETICS

    はじめに 目標の設定と指標の決定 目標の設定 指標の決定 評価指標に対する最低限の知識 機械学習における知識(補足) ニューラルネットワークの学習 最初に使うニューラルネットワーク 時間的にも空間的にも独立である複数の特徴量を持つデータ 空間の局所的な構造に意味のある多次元配列データ(例えば画像) 時間的な変動に意味のあるデータ(例えば音声、自然言語) ニューラルネットワークの細かい設定 ユニットの数と層の数 正則化 活性化関数 ドロップアウト バッチ正規化 学習の早期終了 性能が出ない場合 データの追加収集 ニューラルネットの設定をいじる 用いるニューラルネット自体を変更する 新たなニューラルネットワークの考案 コードを書くにあたって データ成形 結果を記録するコード フレームワークの利用 フレームワークの選択 ChainerとPyTorch TensorFlow Keras 最後に は

    ディープラーニングの応用のための具体的方針まとめ - HELLO CYBERNETICS
  • 統計物理学と機械学習の関係 - HELLO CYBERNETICS

    統計物理学の始まり 統計物理の着想は熱力学にあり 熱力学におけるエントロピーという概念の導入 統計物理学のモチベーション 統計物理学の着想 統計物理学を始める上での基 熱の移動の正体 統計物理学でのエントロピー 統計力学と機械学習 情報統計力学 イジングモデル イジングモデルを更に一般化したスピングラスモデル 統計力学が機械学習にもたらすもの 機械学習での発展 最後に 量子アニーリングコンピュータ ベイズ 統計物理学の始まり まず統計物理学がどんなものかを説明しましょう。ここを定性的にでも把握しておくと、だいぶ機械学習に近しい考え方を持っていることを強く実感できるはずです。 統計物理の着想は熱力学にあり 統計物理学は熱力学からやって来ました。 私達は生活の中で容易に実感できるように、「熱」というものが温度の高い方から低い方へ流れていくことを知っています。運動エネルギーや化学エネルギー、電

    統計物理学と機械学習の関係 - HELLO CYBERNETICS
  • 【ベイズ推定って結局何なの?】 - HELLO CYBERNETICS

    はじめに 理論的背景の1つとしてベイズがある ベイズの考え方 ベイズを使った予測の結論 ベイズ理論 伝統的方法 確率変数と確率分布 確率分布とパラメータ パラメータは唯一無二! ベイズ的な考え方 パラメータは確率的に変動する 何が変わるのか ベイズの定理 普通のベイズの定理 ベイズ的なベイズの定理 実応用にベイズ 機械学習の姿勢 確率的な機械学習の考え 統計パラメータの推定(学習) ベイズによる機械学習の姿勢 ベイズでの予測器 ベイズでの学習 主観確率 ベイズ更新 他の手法との違い ベイズ推定 MAP推定 最尤推定 最後に まとめ ベイズ推定を更に学ぶ場合 ベイズ推定の困難さ 現実的な解決方法 補足 不正確か 関連記事 はじめに 理論的背景の1つとしてベイズがある 「ベイズ」というのは理論的背景・考え方の1つだと思ってもらって構いません。 従って、「自然言語処理」と「画像認識」という分野の

    【ベイズ推定って結局何なの?】 - HELLO CYBERNETICS
  • 機械学習をこれから始める人の線形代数を学ぶモチベーション - HELLO CYBERNETICS

    はじめに 機械学習に使われる主要な数学 線形代数 最も重要な理由 線形代数って何なんだ? 線形代数を学ぶモチベーション 線形代数を学んで、できるようになること 補足 微分積分学は? 確率統計は? 確率・統計を考えていくための初歩を確認したい人は以下の記事へ はじめに この記事は、私が機械学習を学んできて感じた、数学の役割をまとめたものです。記事を書く上で特に意識したのは、ある数学機械学習においてどのように活躍し、どのような旨味をもたらしたのか、そして、そこから数学を学ぶ意義を改めて抑えることです。 数学の解説をすることが目的ではないため、直接的に数学の疑問を晴らすということにはなりませんが、 これから機械学習を学んで行こうという場合に、数学がどのように役立ちうるのか、その全体像を予め把握しておくことに使っていただけると幸いです。 機械学習に使われる主要な数学 多くの書籍、多くの記事が世の

    機械学習をこれから始める人の線形代数を学ぶモチベーション - HELLO CYBERNETICS
  • 機械学習・ディープラーニング・強化学習・ベイズを学べる無料講座 - HELLO CYBERNETICS

    はじめに ここでは、機械学習、ディープラーニング、強化学習、ベイズを無料で学ぶことのできるオンラインリソースを項目ごとにまとめておきます。 機械学習 ITについて学べるオンライン講座「Udacity」は、基的に有料で講座を受けるのですが、中には非常に中身の詰まったコンテンツで、かつ無料の講座も存在します。 以下の講座では、機械学習の各技術に関して広くカバーしており、決定木からサポートベクターマシン、ニューラルネットワークやベイズ、強化学習まで学ぶことができます。 かなりのボリュームなので興味のあるところを学んでいく感じでも良いと思います。 www.udacity.com s0sem0y.hatenablog.com s0sem0y.hatenablog.com ディープラーニング 同じくUdacityからディープラーニングに関する講座です。 多層パーセプトロンから畳み込みニューラルネット

    機械学習・ディープラーニング・強化学習・ベイズを学べる無料講座 - HELLO CYBERNETICS
  • 機械学習で抑えておくべき損失関数(回帰編) - HELLO CYBERNETICS

    はじめに ニューラルネットワーク 損失関数を考えるモチベーション 回帰の損失関数 色々な損失関数 二乗損失 分位損失 Huber損失 感度損失(ε-許容損失) 損失関数の図示 二乗損失 分位損失 Huber損失 ε-感度損失(ε-許容損失) 比較 損失関数の使い分け1 損失関数の使い分け2 損失関数の使い分け3 最後に 分類に関する損失関数 はじめに 機械学習における教師あり学習では、入力に対してパラメータを用いて関数を構築し、正解データに対して損失を定義し、これを最小化する手続きを取ります。 損失を、色々なとの組に対して計算し、その総和が最小化されるようにを決めることを学習と呼びます。これにより未知のデータを入力した時に、それに対する正解をが出力してくれることを期待するのです。 学習がの最小化という目標に従っている以上、このをどのような形にするのかが重要になるのは言うまでもありません。

    機械学習で抑えておくべき損失関数(回帰編) - HELLO CYBERNETICS