タグ

Statisticsに関するstray346のブックマーク (8)

  • 使える統計モデル10選(前編) | AIdrops

    使える統計モデル10選(前編) 統計モデリング(statistical modelling)はデータ解析の方法論の1つです。データ解析の目的は、通常はただの数値や記号の羅列であるデータから、人間が何かしらの判断を行うために有益な情報を引き出すことにあります。データ分析者は、そのままでは意味をなさないデータに対して、折れ線グラフやヒストグラムなどを用いて、人間が判断を行いやすいようにデータの可視化を行います。一方で、時にはニューラルネットワークのような複雑な計算モデルを使ってデータを解析し、まだ観測されていない将来の値を予測させたりします。このように、データから有益な情報を引き出すために、データに対して人為的な視点や事前知識、数学的な仮定などを設計する作業をモデリング(modeling)と呼びます。 統計モデリングによるデータ解析では、データ自体や解析の目的に合わせて分析者が適切なモデルを設

    使える統計モデル10選(前編) | AIdrops
  • なんJ PRIDE : 【野球】アメリカ人「暇だからNPBのデータまとめたやで~」

    >>11 アメリカ人から見ればメジャー以外の オランダ、イタリア、中国、オーストラリア、韓国と同じ扱いなのはしゃーない

  • 白書や統計などの公表データがより一層活用しやすくなります~オープンデータ実証用サイト「Open DATA METI」(β版)の公開~(METI/経済産業省)

    経済産業省は、日、オープンデータを実現していくための実証用サイト「Open DATA METI」(β版)(http://datameti.go.jp)を公開します。 この取組は、経済産業省が保有している白書や統計などの公表データを、これまで以上にビジネスなどの民間での利活用につなげるため、より加工しやすい形で保有データを公開するものです。

  • Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ!

    こんにちは!今年の春からWeb系企業でHTML/CSSデザイナーとして働きだしたキラキラ女子(を目指してる)のあんちべ(23)です!よろしくお願いします!私は普段自社のWebサービスCSSなどを書いている*1のですが、最近データマイニングに興味を持ち始め、データを分析して、自社サービスの売り上げ改善に貢献したいなーと思うようになりました!でも。。。私は文系出身で統計学とか全然わからない*2し、プログラミングも得意じゃない*3し、高価な統計解析ソフトを買うのも辛いです。。。無い無い尽くしですね><;!そんな私に救いの手が!インストール作業不要で、便利な統計処理機能が色々あって、しかも無料という素晴らしいソフト*4を発見しました!その名も"Incanter"です!なんでも、 Lispっていう古くから使われてきた実績のあるプログラミング言語で動いてて、Lispの文法でどんな処理をすればよいかを

    Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ!
  • 日本のブラウザシェア率

    Sorry, JavaScript is required to view Global Stats charts.

    日本のブラウザシェア率
  • 二項分布

    ■二項分布 【要約】 確率変数 X が二項分布 B(n, p) に従うとき,q = 1 - p とすると

  • 二項分布を正規分布で近似する

    二項分布を正規分布で近似する 二項分布の式 には階乗が含まれるため、そのまま計算しようとすると、試行回数nが大きくなるほど、膨大な計算量になってしまう。しかし一方で、nが大きくなるほど二項分布は正規分布に近づいていくので、正規分布で近似することができる。 (なぜ正規分布に近づくのか、という議論は、長くなるので、残念ながらここでは省略する。) 正規分布 normal distribution は、一般に で表される。なかなかややこしい式だが、平均μ=0、分散σ=1なら、 となって、計算しやすくなる。これが標準正規分布 standard normal distribution である。 二項分布では 平均はnp 分散はnp(1-p) になるので、n回の試行でx回「以下」「1」が出る場合の確率を として、平均が0、分散が1の標準正規分布で近似して計算することができる。この式では、分子で平均値を0

  • 二項分布と正規分布

    §2の続きです。二項分布の確率計算は,考え方はとても簡単なのですが,計算が少々めんどうです。 そこで,登場するのが正規分布近似です。右のアプレットをご覧ください。n は試行回数を表し,p はそれが起こる確率を表します。バーを上下に動かすことにより,二項分布,正規分布(密度関数)のグラフが変化します。 p の値が 0.5 に近い程,n の数が少なくてもよい近似となることが分かります。多くの問題集において,「n が十分大きいので,正規分布で近似すると」とありますが,右のグラフの変化をみることにより,視覚的に確認することができます。 では,二項分布を正規分布で近似するための準備を行います(詳細については,各種分布の§3二項分布を参照してください)。 もう一度,正規分布表を用いた確率の求め方の手順のおさらいを行いましょう。 例題1 確率変数 X が,平均 μ=6,標準偏差 σ=1.5 の正規分布

  • 1