タグ

統計に関するsotukenyouのブックマーク (66)

  • 【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita

    統計学や機械学習をを勉強していると「尤度」という概念に出会います。まず読めないというコメントをいくつかいただきましたが、「尤度(ゆうど)」です。「尤もらしい(もっともらしい)」の「尤」ですね。犬 じゃありませんw 確率関数や確率密度関数を理解していれば数式的にはこの尤度を処理できると思うのですが、少し直感的な理解のためにグラフィカルに解説を試みたいと思います。 コードの全文はGithub( https://github.com/matsuken92/Qiita_Contents/blob/master/General/Likelihood.ipynb )にも置いてあります。 正規分布を例にとって 正規分布の確率密度関数は f(x)={1 \over \sqrt{2\pi\sigma^{2}}} \exp \left(-{1 \over 2}{(x-\mu)^2 \over \sigma^2

    【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita
  • ロボティクスを学ぶのにおすすめの書籍・資料 - MyEnigma

    確率ロボティクス (プレミアムブックス版) 目次 目次 はじめに 『Probabilistic Robotics』(確率ロボティクス) Sebastian Thrun 他 『パターン認識と機械学習』C.M. ビショップ 『Principles of Robot Motion: Theory, Algorithms, and Implementations』Howie Choset 『マンガでわかる統計学シリーズ』高橋 信 『図解・ベイズ統計「超」入門』涌井 貞美 『プログラミングのための確率統計』平岡 和幸,堀 玄 『Introduction to Applied Linear Algebra: Vectors, Matrices, and Least Squares』Stephen Boyd, Lieven Vandenberghe 『Convex Optimization』Stephe

    ロボティクスを学ぶのにおすすめの書籍・資料 - MyEnigma
  • トップページ - RESAS 地域経済分析システム

    地域経済分析システム(RESAS:リーサス)は、地方自治体の様々な取り組みを情報面から支援するために、内閣官房デジタル田園都市国家構想実現会議事務局が提供する、産業構造や人口動態、人の流れなどの官民ビッグデータを集約し、可視化するシステムです。

    トップページ - RESAS 地域経済分析システム
  • AIが競馬予想で回収率180%突破の快挙! 『電脳賞』優勝のITエンジニアが語る戦略が鮮やかすぎて目からウロコ

    どうも、「電ファミ」では競馬担当になりつつある、長谷川リョーです。 前回は北海道まで出張取材をした「リアルダビスタ」の記事をお届けしました。「将来の夢は馬主になることだ」と競馬への愛についても触れさせていただきましたが、馬券の方も嗜みます。週末は重賞を中心に、平場のレースまで手広く買うことが多いです。 (Photo by Getty Images) 1度だけ万万万馬券を当てたことがあり、生涯収支は間違いなくプラスなのですが、あの大当たりがなければ間違いなく回収率は100%を下回っていたことと思います。(僕だけではなく、おそらく多くの人が同じ現状だと思います……) 普段はAI人工知能)、IoT、VRのようなテクノロジー周りの取材記事を書くことも多く、「ディープラーニングのような技術を元に、競馬予想をするプログラムを作ることができるのでは?」と夢想したことも一度や二度ではありません。IT企業

    AIが競馬予想で回収率180%突破の快挙! 『電脳賞』優勝のITエンジニアが語る戦略が鮮やかすぎて目からウロコ
  • 成長曲線(シグモイド関数、ゴンペルツ曲線、ロジスティック曲線、ロジスティック回帰分析)<確率・統計<Web教材<木暮

    シグモイド関数、ゴンペルツ曲線、ロジスティック曲線、ロジスティック回帰分析。オッズ比、ロジット 参照:JavaScriptの計算プログラム 生物の個体数、新製品の販売数、プログラムのバグ発見数など、当初は少なく、中途で大きくなり、その後また少なくなるような現象は多くあります。それを時間の推移と累積量をグラフにすると、下図のようになります。これを成長曲線といいます。 基的な形式にシグモイド関数があります。 代表的な成長曲線に、ロジスティック曲線とゴンペルツ曲線があります。両者とも、似たようなS字型の曲線で、時間xが経つにつれ、増加が止まり一定値Kに近づきます。 その違いは、増加を規定する考え方、すなわち dy/dx にあります。 ロジスティック曲線 dy/dx = Ay (K-y) ゴンペルツ曲線   dy/dx = Ay e-cx 両者とも現在の個体数に比例して増加しますが、減少要因がロ

  • EAFAQ113

    (1)C19: =0.5と仮に置きます (2)C20: この段階では未知数のままとします。 (3)C21: 同じくこの段階では未知数のままとします。 (4)C2: 残差を求めます。 =B2-$C$20/(1+$C$21*(exp(-$C$19*A2)) つまり y - a/(1+b*(exp(-cx))です。以下C16まで式コピーします。この段階での数値には意味はありません。 (5)C17: 残差の平方和を求めます。 =SUMSQ(C2:C16)です。 この段階での数値には意味はありません。 (6)以上で準備が完了しました。「ソルバー」を用いて,残差平方和についての最小2乗法を実行し,係数a,bを求めます。ソルバーの使い方はQ71を参考にしてください。[ツール]-[ソルバー]から,「目的セル」はC17,「目標値」は最小,「変化させるセル」は$C$20,$C$21,「制約条件」は大

  • MATLAB Note/統計/確率分布 - Miyazawa’s Pukiwiki 公開版

    確率分布(確率密度関数) † 確率分布の特性と分類に関して、さまざまな確率分布(滋賀大中川先生) に総合的な解説があります。 以下、Statistics Toolbox の関数を使用します。 参考:Statistics Toolbox でサポートされている確率分布 Rでも同じことができるはずです。R Note/統計/確率分布 を参照して下さい。 ↑ 連続変数(Continuous variable) † 連続的に変化する値の出現頻度を扱う分布。 【引用】 (略)棒が倒れる方向 X は、0 から 360°の間の任意の値を取ることができます。このような分布を連続型分布といいます。(略)ここで注意してもらいたいのは、離散型分布の確率関数とは異なり、確率密度関数 f(x) は、X が 値 x を取るときの確率を表しているわけではないことです。(略)なぜなら、倒れたときの角度がある特定の値に完全に一

  • 統計科学・機械学習の講義

    統計科学や機械学習、および関連する諸分野の講義・講演のアーカイブです。講師名の敬称は略させて頂いています。★の数は専門性・予備知識の量を示します。★1つは一般の方でも楽しめる部分のある講演(レベルが低いという意味ではありません)、★2つは大学院生向きとして標準程度、★3つはより専門的な講演、をそれぞれ示します。

    統計科学・機械学習の講義
  • ロジスティック回帰

    ● ロジスティック回帰とは みなさんこんにちは。 さて、今日はロジスティック回帰というものを取り上げます。 前回の項目で回帰、というものをやりました。 単回帰や重回帰によってデータの変化の傾向を見る、そういうものでしたよね。 しかし、実際の動物データを扱う場合、データによっては一つ問題点があります。 それは、「データに一定の上限値が存在する。」ということです。 少し想像してみましょう。 ブタを飼育し、その体重を計測していた場合、ブタの体重は無制限に増加する事は考えられませんよね。 もしくは自分の身長や体重を思い浮かべてみるともっと分かりやすいでしょうか。 このような一定の上限値が存在するデータの場合、予測されるグラフは以下のようになります。 このような、S字状の曲線を描いたグラフをロジスティック(成長)曲線と言います。 このように定めたロジスティック曲線にデータを当て

  • 統計学入門−第10章

    10.3 ロジスティック回帰分析の計算方法 (1) 最小2乗法を利用する方法 ロジスティック回帰分析ではロジットの回帰誤差が特殊な分布になり、普通はその分布を理論的に確定することができません。 そのため回帰誤差が近似的に正規分布すると見なして、重回帰分析と同じように最小2乗法を利用して回帰分析を行う方法と、最尤法を利用した繰り返し近似計算によって回帰分析を行う方法の2種類があります。 最初に最小2乗法を利用する方法について説明しましょう。 この場合の線形ロジスティックモデルは次のようになります。 このモデルでは説明変数xjの値を研究者が任意に指定した時、ロジットの回帰誤差εが近似的に正規分布すると仮定します。 ただしロジスティック回帰式を計算するには回帰誤差の正規性は必要ではなく、検定を行う時だけ回帰誤差の正規性が必要になります。 そして説明変数は研究者が任意の値を指定するので誤差がなく、

  • データ & アナリティクス | アクセンチュア

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    データ & アナリティクス | アクセンチュア
  • エクセルでの標準誤差の計算方法

    例題:ある鳥の卵10個の重さを量ったところ,15.4, 15.8, 15.9, 16.1, 16.2, 16.4, 16.6, 16.8, 16.9, 17.5gであった.

  • エクセルを用い平均値と標準偏差から偏差値を計算する

    n人のクラスでテストをしました。その結果をt1,t2,t3・・・・・tn点とします。 このクラスの平均値(Av)は全点を合計し、人数で割ります。 平均値(Av) = ( t1 + t2 + ・・・・ + tn ) / n Aクラスでは全員が50点でした。Bクラスでは半数が0点で半数が100点でした。 この場合、A,Bクラスとも平均点は50です。でも、Bクラスはずいぶん点数がばら ついているので、先生はたいへんですね。 このばらついている程度を示す指標が標準偏差(σ)です。 各点数と平均値の差を平均すればばらつきがわかります。 { ( t1- Av ) + ( t2 - Av ) + ・・・・・+( tn - Av ) } / n しかしながら、この計算では(点数ー平均値)の正、負が相殺し、0となります。 そこで、負数がなくなるよう、(点数-平均値)を2乗してから合計し、

  • 面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!

    転職して丁度2年がたちました。 現在はWebベンチャーで統計屋しています。大変楽しい毎日です。 なぜ楽しいかというと勿論リスプを書いているからというのも大きなる理由の一つです*1。 このエントリでは何が楽しいのか近況交えてつらつらまとまりなく書いてます。 あと現職の解決しがたい不満についても書いています。 糞長くなってしまったので要約すると 「今糞面白いけど超えられない壁あるので誰か助けて」 です。 現職面白い理由5個。 1.データが面白い*2 私は経済学科・数理統計の研究室出身で、応用先としてコミュニケーション活性化を目的とした 行動経済学やテキストマイニングをやっていました。 そういう背景があるため、学生時代いつか壮大な社会実験をやりたいと思ってたけど、 それには大変なお金がかかったり大がかりなシステムを構築しないといけなかったりで断念した。 ですが今はSNSやソーシャルゲームや広告の

    面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!
  • 私のための統計処理ー基本解説

    実験はギャンブルのようなもので、 どんな結果が出るかはわからないが、 実験計画を立てる。 「2群に差がない!」という帰無仮説を立てる。 群間のサンプルの選択は公平にしなければならないが、 勝率が高くなるような実験計画をデザインも必要である。 生物実験では、物理科学実験とは異なり、 得られるデータは必然的にばらつきを伴う。 測定者による誤差 ---実験技術の向上に伴い、 データの信頼度は上がる! 測定装置、あるいは測定方法による誤差 測定されるものの性質による個体差

  • http://atiboh.sub.jp/t09takoushiki2.html

    Excelの関数を用いて多項式近似(2次)の定数を求めます。 「Excel ・グラフウィザード」の近似曲線 (多項式近似 <2次> )」は、Excelが提供する便利な機能の一つです。 多項式2次の式 y = a + bx + cx^2 (Excelではy = b + c1x + c2x^2 )の式です。 多項式近似(2次)とは、データが放物線状(凸凹が一つ) (1)データは、A1セルからB7セルに入力されています。(下記の図) (2)多項式2次のため作業列を使用します。 作業列はA11セルからB17セルを使用します。 A11セルには「x」と入力 A12セルからA17セルにはA2セルからA7セルの数値をコピー B11セルには「x^2」と入力 B12セルの式は「=A12^2」と入力 B12セルの式をB13セルからB17セルにコピー (3)多項式2次の式(y = a + bx +

  • http://shower.human.waseda.ac.jp/~m-kouki/pukiwiki_public/117.html

  • データからワンランク上の規則性を見つけるために 「分散」と「標準偏差」をざっくり理解し、エクセル分析しよう

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    データからワンランク上の規則性を見つけるために 「分散」と「標準偏差」をざっくり理解し、エクセル分析しよう
  • t検定 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "T検定" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2015年9月) t検定(ティーけんてい)とは、帰無仮説が正しいと仮定した場合に、統計量がt分布に従うことを利用する統計学的仮説検定の総称である。母集団が正規分布に従うと仮定するパラメトリック検定法であり、t分布が直接、もとの平均や標準偏差にはよらない(ただし自由度による)ことを利用している。2組の標について平均に有意差があるかどうかの検定などに用いられる。統計的仮説検定の一つ。日産業規格では、「検定統計量が,帰無仮説の下でt分布に従うことを仮定して行う統計的検定。」と定義してい

  • Q1

    Q1:相関と回帰の違いは何か?2つの変数の比例関係を見る点では相関も回帰分析も変わりないように思われるが…。 A1:2変数がどれくらい散らばっているかを表すのが相関[係数]である(図1a)。一方の変数から他方の変数を予測するために最も都合の良い直線を引くのが回帰[分析]である(図1b)。これらの目的は根的に異なり,Altman1)も両者を同時に求めることはあり得ないと述べている。従って,事前に「比例関係」とは何かを明確に定義づけて使い分けるのがポイントとなろう。 同一のデータであっても,相関係数と回帰係数が大きく異なることは意外に多い。1つの例を挙げよう。図2aは相関係数と回帰係数が,ともに1の直線関係にある例である。さて図2bは図2aと比べて回帰式が変化せず,相関係数のみが低くなった例である。回帰係数はyに対し,x方向からみて誤差が最小となるような直線を引くから1になるのである。もちろ