筑波大HCOMP研究室の勉強会資料です. 内容はベイズ深層学習(著 須山敦志)の3.3から3.4節です. 日本一(誇張)ベイズ線形回帰の計算を丁寧に書いたつもりです. 本に誤記の"可能性"があります.(自分の計算が間違っている可能性もある.) 違うとかあれば連絡ください.
時系列データに対して、移動平均や指数平滑を施すことで、需要変動に追随しながら、予測を行うことができる。販売トレンドの変化に対しては、徐々に変化を取り入れながらトレンド変化に追随性のある予測値を生成することができる。特に、ホルト線形法はトレンド変化に関しては、追随性の高い予測値を生成することができる。しかし、これらの手法は、いずれも季節性を考慮した予測値を生成することはできない。さらに、特売、イベント、曜日変動等のコーザルによる影響を考慮することもできないので、通常は、コーザルの影響を受けているデータはあらかじめ除去し、平時の需要予測を行う用途に限定して利用される。もし、コーザル・データを除外しない場合は、特売後に需要予測が大きくなるなどの問題が生じる。 ホルト線形法がトレンドしか考慮できないのに対して、この方法では季節変動とトレンドを考慮した予測値を生成することができる。外部で作成した季節
googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系の本は最近増えてきましたが、統計学自体が基礎から学べる本はまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =
1年あたり平均0.61人の兵士が馬に蹴られて死ぬ軍隊において、「1年に何人の兵士が馬に蹴られて死ぬかの確率の分布」を求める。 それが、歴史上で初めてポアソン分布が使われた事例だと言われています。 以来、ポアソン分布は主に「ランダムに起きる事故・病気の発症」などにおいて「特定の期間中に何回起こる確率が何%あるのか」を可能な限り正確に把握することで、適切なリスク管理を行うのに活躍しています。 photo credit:Moyan Brenn ポアソン分布とは?ポアソン分布とは、(どの時点でも同様な起こりやすさでランダムに起こる現象と仮定した場合に)「単位時間あたりに平均 λ 回起こる現象が、単位時間に k 回起きる確率」を表すのに使われる確率分布のこと。 この「単位時間あたりに平均 λ 回起こる現象が単位時間に k 回起きる確率」は多くの場合、以下の式で表されることが分かっています。 この式は
なぜランダム化が必要なのか? なぜ二重盲検ランダム化臨床試験が必要なのか? ランダム化の方法 特殊なランダム化 ランダム化後に生じた治療切り替えの問題
318 化学と生物 Vol. 51, No. 5, 2013 セミナー室 研究者のためのわかりやすい統計学-1 統計検定を理解せずに使っている人のために I 池田郁男 東北大学大学院農学研究科 319 化学と生物 Vol. 51, No. 5, 2013 1 1 320 化学と生物 Vol. 51, No. 5, 2013 2 μ σ σ 3 * 2 3 * 321 化学と生物 Vol. 51, No. 5, 2013 4 * 5 * 6 σ 4 5 6 σ * * 322 化学と生物 Vol. 51, No. 5, 2013 μ μ μ μ μ σ 7 σ σ σ σ σ σ σ σ σ σ 8 8 9 7 σ 323 化学と生物 Vol. 51, No. 5, 2013 9 10 11 * σ σ * * * * 10 11 * * * * 324 化学と生物 Vol. 51, No.
はじめに: 統計学の重要性 NTT データ数理システムでリサーチャーをしている大槻 (通称、けんちょん) です。 今回は統計検定 1 級について記します。 統計検定とは日本統計学会による公認の資格であり、統計に関する知識や活用力を評価するものです。 日常的に大量のデータが溢れている昨今、データ分析や機械学習に対するニーズは最高の高まりを見せています。最近では何も考えずともただデータを入力するだけでデータ分析や機械学習手法を実行してくれるツールも多数出回るようになりました。 データ分析や機械学習を実際に遂行するにあたって、統計学は強力な基礎になります。確かに最近は便利なツールの発達のおかげで、統計を学ばずともデータ分析を実行できる環境が整いつつありますが、その状態でデータ分析手法や機械学習手法を実際に適用しようとすると、しばしば誤った推論をしてしまったり、複雑な状況に対してどのようなアプロー
こんにちは.野球(とグルメ)の人です.*1 ビックデータや統計学が相変わらずアツい話題になっている中,野球好きとデータ好きをうならせるこんな本が出版されました. [プロ野球でわかる! ]はじめての統計学 作者: 株式会社DELTA,佐藤文彦,student,岡田友輔出版社/メーカー: 技術評論社発売日: 2017/03/14メディア: 単行本(ソフトカバー)この商品を含むブログを見る この本,早速読ませてもらってとても良い!感銘を受けた!!という感じなのですが, そもそも世の中に野球統計学(セイバーメトリクス)の本が増えてきた (野球好きでも)初心者がいきなり読んだら辛い本もあるぞ! ???「ワイも野球データを集めて分析したいンゴ」 …などなど,クエスチョンやテーマができたので, 今まで学んだ・実践した野球統計学の学び方・本・データを整理するのにいい機会だ! …ということで, レベル別の本
さて皆さん、「数字は魔物、統計は数字のトリック」などと言われ、統計学はある人々からは疫病神のように忌みに嫌われ、またある人々からは金科玉条のごとく無条件に信奉され、はたまた別の人々からは塵芥のごとく無視されています。 しかしやかましくいわれている割には、その本質が十分理解されているとはいい難いのが現状ではないでしょうか? 研究現場の研究者が統計手法を利用する時に犯す間違いのうち、ほぼ90%のものが非常に初歩的なものです。 そしてそれらの間違いは研究者が統計学の基本的な事柄をはっきりと理解していないか、あるいはそれらを誤解していることが原因になっています。 例えば研究現場でしばしば間違って使われている統計手法のベスト3は次のようなものです。 有意確率(p値)と「有意差あり」の意味 標準偏差(SD)と標準誤差(SE)の使い分け 多重比較の使用方法 これらは全て非常に初歩的かつ基本的なことです。
こんにちは!今年の春からWeb系企業でHTML/CSSデザイナーとして働きだしたキラキラ女子(を目指してる)のあんちべ(23)です!よろしくお願いします!私は普段自社のWebサービスのCSSなどを書いている*1のですが、最近データマイニングに興味を持ち始め、データを分析して、自社サービスの売り上げ改善に貢献したいなーと思うようになりました!でも。。。私は文系出身で統計学とか全然わからない*2し、プログラミングも得意じゃない*3し、高価な統計解析ソフトを買うのも辛いです。。。無い無い尽くしですね><;!そんな私に救いの手が!インストール作業不要で、便利な統計処理機能が色々あって、しかも無料という素晴らしいソフト*4を発見しました!その名も"Incanter"です!なんでも、 Lispっていう古くから使われてきた実績のあるプログラミング言語で動いてて、Lispの文法でどんな処理をすればよいかを
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く