タグ

ブックマーク / logics-of-blue.com (11)

  • 統計学の講義資料(2022年度) | Logics of Blue

    帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 目次 資料について 統計学の講義資料 1.資料について 帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 もとの講義資料とは異なる点もあるのでご注意ください。 万が一何か問題があれば、当ブログにコメントをいただけますと幸いです。 スライドにも記載の通り、以下の利用を想定しています。 想定①:講義の受講者が復習に利用する 想定②:未受講者が統計学入門資料として利用する 基的には想定①ですが、文系の学生をメインターゲットとした統計学の格的入門資料は少ない印象です。 未受講者の方にも役に立つかもしれないと思いWeb上で公開することにしました。 資料は1年間にわたる講義資料となっています。数回

  • ビジネス意思決定における期待値最大化原理の適用についての諸課題 | Logics of Blue

    記事では、意思決定の手続きについて、ビジネス適用を念頭において解説します。 意思決定の方法としては、期待値最大化に基づく方法を中心に解説します。 記事は『機械学習とビジネスを橋渡しするものこそ評価指標であり, ”全てのビジネスは条件付期待値の最大化問題として書ける”仮説についての一考察』の内容を受けたものです。「先のブログ記事」と表現したら、それは常にこの記事を指します。 なお、当方は「期待値最大化の原理は、唯一絶対の意思決定の原理というわけではない」と考えています。それと同時に「期待値最大化の原理をもっと広めたい。これをスタート地点として、もっと多くの工夫を生みだしたい」とも思っています。 記事においては、期待値最大化の原理を適用する際の諸課題について言及しますが、これは「期待値最大化という意思決定の原理を使うべきではない」ということを意味しません。「期待値最大化という意思決定の原

  • 意思決定分析と予測の活用:サポートページ | Logics of Blue

    『意思決定分析と予測の活用 基礎理論からPython実装まで』のサポートページです。 書の略称は「決定分析」です。 書の内容を含む、決定分析について、管理人Twitterでハッシュタグ「#決定分析」をつけてつぶやくので、こちらも参考にして下さい。 この記事では、書籍の特徴などの紹介をしています。 書に使用したサンプルデータと実装コードは、すべてGitHubから参照できます。 なお、書籍情報は2021年1月9日現在の内容です。出版されるまでに変更される可能性があります 意思決定分析と予測の活用 基礎理論からPython実装まで 2021年2月25日より順次発売予定。 第1部は全文を公開しています。 出版社の書籍紹介ページはこちらです。 →詳細目次はこちらを参照してください。 大変ありがたいことに、書評をいただきました。ありがとうございます! 【書評】意思決定分析と予測の活用 基礎理論

    Aobei
    Aobei 2021/01/09
  • 状態空間モデルをStanで推定するときの収束を良くするコツ | Logics of Blue

    この記事では、状態空間モデルをStanで推定するときの収束を良くするコツを説明します。 コードはGitHubから参照できます。 状態空間モデルは説明能力が高く、データに合わせて柔軟に構造を変えることができます。しかし、あまりに複雑な構造を指定すると、結果が収束しないこともしばしばあります。 収束が悪い時には、弱情報事前分布を指定したり、MCMC実行時の設定を変える(iterやwarmupを増やす等)で対応することが多いと思います。こちらの方法で多くの場合は解決しますが、複雑なモデルですと、そもそものStanコードの実装の方法から変えた方が良いかもしれません。 この記事では、状態空間モデルの収束を良くするために、Stanコードの書き方を工夫するやり方を紹介します。 良いやり方は無いかなと調べていたところ『Bayesian structural time series modeling』という

  • 時系列データへの回帰分析 | Logics of Blue

    新規作成:2017年05月16日 最終更新:2017年05月16日 ここでは、時系列データを手にした際に、どのような手順で回帰分析をかけていけばいいのか、フローチャートを交えて解説します。 時系列データは特殊でして、普通の回帰分析を行うと、p値がおかしくなり、正しく検定ができなくなることがよくあります。これを見せかけの回帰と呼びます。 シミュレーションを通して、見せかけの回帰という現象を確認したうえで、それらに対応する手法としての単位根検定・共和分検定・一般化最小二乗法(GLS)の基的な考え方とRでの実装方法について説明します。 ソースコードはまとめてこちらに置いてあります。 スポンサードリンク 目次 時系列データへの回帰分析フローチャート 単位根と見せかけの回帰 データチェック1 単位根検定とADF検定 解決策1 差分系列への回帰分析 差分系列への回帰分析の問題点 データチェック2 共

    時系列データへの回帰分析 | Logics of Blue
  • Rによる機械学習:caretパッケージの使い方 | Logics of Blue

    ニューロンの個数を2パタン。 データへの依存度を3パタン用意すると、2×3=6パタンも試さなければなりません。 大変に面倒ですが、このハイパーパラメタを雑に設定すると予測精度が落ちてしまうこともよくあります。 めんどくさいですが、なるべくやったほうがいいです。 4.モデルを使って予測する これは簡単。単に予測をするだけです。 パッケージを使っていれば、たいていは予測用の関数が用意されています。 5.予測の評価をする 最後は評価です。 評価をすることによって、 ・どの手法の ・どのパッケージの ・どのパラメタを 採用すべきかを判断します。 で、一番予測精度がいいやつを使って予測することになります。 たくさんの手法、たくさんのパッケージ、たくさんのパラメタの組み合わせをしらみつぶしに評価する。 普通にこれをやろうと思うと、気が遠くなってしまいますね。 そこで登場するのがパッケージ「caret」

  • ”慣れ”の統計モデリング:Stanで推定する時変係数モデル | Logics of Blue

    新規作成:2015年12月13日 最終更新:2016年9月22日 ローカルレベルモデルくらいでしたらdlmパッケージでも簡単に推定できます。 せっかくStanを使うのですから、もっと複雑なモデルを作ってみましょう。 今回は回帰係数が時間によって変化するモデルを作成します。 なお、今回の記事はちょっと複雑なモデルを作成する都合上、実験的な要素もあります。 そのため、ほかの記事に比べると、記載内容の精度が落ちております。この記事を参考にされる場合は、この点、注意してください。 すべてのコードをまとめたものはこちらにおいておきました。コピペする際はこちらを使用してください。 この記事はベイズ推定を応用して状態空間モデルを推定する一連の記事の一つです。 記事の一覧とそのリンクは以下の通りです。 ・ベイズ統計学基礎 ・ベイズと統計モデルの関係 ・ベイズとMCMCと統計モデルの関係 ・Stanによるベ

  • 確率密度関数と正規分布 | Logics of Blue

    ここでは統計学の難所、確率密度関数について説明します。 確率密度関数の意味と使い方をぜひ学んでください。 目次 1.確率密度関数とは何か 2.なぜ確率密度関数が必要か 補足:確率と確率密度 3.正規分布 4.正規分布の使い方 5.正規分布がある時とない時でのデータ分析の方法の比較 6.「○○分布に従うと仮定する」ことの意義と弊害 補足:中心極限定理 スポンサードリンク 1.確率密度関数とは何か 確率密度関数とは、確率、あるいは確率密度を計算する関数のことです。 例えば、0.2×aで確率が求まるとします。aが3なら、確率は0.6です。このとき「a =3になる確率は0.6」と解釈します。 「0.2×a」でも、「a÷3+0.01」でもなんでもよいです。確率を計算する関数が確率密度関数です。 ただし、確率分布は、合計値が1になる必要があります。 なので、例えば確率密度関数が「0.2×a」なのだとし

  • Stanによるベイズ推定の基礎 | Logics of Blue

    新規作成日:2015年12月5日 最終更新日:2016年9月22日 理論がわかっても、実践ができなければ意味がありません。 ここでは、Stanというフリーソフトを使って、ベイズ統計学をもとにしたパラメタ推定をパソコンで実行する方法を説明します。 ベイズとMCMCの組み合わせでもって統計モデルのパラメタを推定することができるのでした。この方法を、以下では「ベイズ推定」と呼ぶことにします。 ここでは、Stanを用いて統計モデルのパラメタのベイズ推定をする方法を説明します。 重要な点は、「Stanの使い方」を覚えるだけではうまくいかないということです。 Stanの内部で使われているのは乱数生成アルゴリズムです。乱数を生成してパラメタを推定するという行為は、最小二乗法なりで方程式を解き、パラメタを一発で推定するやり方とは大きく異なります。 その違いをぜひ理解なさってください。 コードをまとめたもの

    Aobei
    Aobei 2016/06/01
    初心者、入門
  • なぜ状態空間モデルを使うのか | Logics of Blue

    最終更新:2016年1月24日 このサイトでは統計学や統計モデルの紹介を多くしています。 その中でも、状態空間モデルは、力を入れている分野の一つです。 ところで、なぜ状態空間モデルを使う必要があるのでしょうか。 そもそもにおいて、統計モデルを使う必要性はどこにあるのでしょうか。 今回は個々の手法の説明ではなく「なぜそれを使うのか」という理由を解説します。 スポンサードリンク 目次 1.なぜモデルを使うのか 2.なぜ統計モデルを使うのか 3.なぜ状態空間モデルを使うのか 4.なぜたくさんのモデルを統一的に表せると便利なのか 5.状態空間モデルを使う注意点 6.状態空間モデルの御利益 7.おまけ:統計モデルと機械学習の違い 1.なぜモデルを使うのか モデルとは、「見やすくなるように簡略化したもの」です。 モデルを作る行為、すなわちモデル化とは、「見やすくなるように簡略化すること」です。 例えば

    Aobei
    Aobei 2015/09/17
  • VARモデル | Logics of Blue

    最終更新:2016年1月24日 Rを用いたVARモデルの簡単な解説と計算方法を載せます。 目次 1.VARモデルとは 2.VARモデルの仕組み 3.VARな予測 4.VARあれこれ スポンサードリンク 1.VARモデルとは 以前紹介したのは1変量のARIMAモデルというものでした。 これは「過去の自分のデータから将来の自分を予測する」というものです。たとえば、2000年にサンマがたくさんいたら過去の2001年にもたくさんいることになるだろうという風に、サンマの予報をするなら、サンマの漁獲量だけに注目してして予測をします。 でも、去年餌になるプランクトンが多かったから今年はサンマが増えた、という風に、「ほかのやつら」の影響を受けているかもしれませ ん。 そんな場合をモデルで表して予測をしてやろうというのが今回扱うVARモデルというものになります。 2.VARモデルの仕組み VARとは Vec

  • 1