タグ

確率に関するTensorのブックマーク (11)

  • 第7回 代表的な離散型確率分布 | gihyo.jp

    今回は、前回導入したNumpy、そしてグラフを描画するmatplotlibを使って、いくつかの代表的な分布を紹介していきます。 第5回「「よく使う分布」はどうしてよく使う?」の項でも代表的な分布が紹介されていました。そこでは、“⁠この状況(モデル)では、この分布を使う⁠”というパターンを想定する、それが“⁠よく使う分布⁠”がいくつも存在する理由と言及されていましたが、どのような状況でどのような分布を使えばいいのでしょうか? 実際、どのような状況のときに、どのような分布を使うと説明しやすいかを考えながら、みていきましょう。 matplotlibのインストール matplotlibはpythonとNumpyのための高機能なグラフ描画ライブラリです。今後もグラフを描画することがあるかと思いますので、ここでインストールしておきましょう。 公式サイトのダウンロードから各OS向けのパッケージを入手して

    第7回 代表的な離散型確率分布 | gihyo.jp
  • 第6回 Numpyの導入 | gihyo.jp

    今回は第3回の冒頭で紹介した、Numpyの導入方法と簡単な使い方について説明します。次回で様々な分布を扱うためにNumpyの準備をしておきましょう。 Numpyの導入 Numpyはオープンソースの拡張モジュールで行列や多次元配列と、それらを操作するための数学関数ライブラリを提供しています。Numpyの内部はC言語で実装されているため、普通にPythonで実装した時と比較するとはるかに高速に実行することが可能です。 ここではインストールの仕方とNumpyの簡単な実行例を確認しておきましょう。 インストール WindowsMacOSXのPCにNumpyをインストールする場合は、NumpyのサイトのDownloadのページの上の方にあるNumPyのProjectからインストール先のマシンのOSに対応したファイルをダウンロードして実行してください。 しかし、MacOSXにデフォルトでバインドされ

    第6回 Numpyの導入 | gihyo.jp
  • 第5回 正規分布[後編] | gihyo.jp

    統計的機械学習では解きたい問題にあわせて様々な分布を扱いますが、中でももっとも重要なのは、今回紹介する正規分布です。 まずはウォーミングアップ代わりに、前回のおさらいです。前回は、確率変数の値を実数のような「連続な数」で表す「連続確率」について説明しました。 連続確率は、サイコロの目ような「離散確率」とは異なり、「⁠確率密度関数」というものを導入し、「⁠確率密度関数 f(x) の積分値=面積=確率」として定義します。確率を「点」に対して考えるといろいろと都合が悪いので、「⁠範囲」に対して考えるのでしたね。 分布が確率であるためには「足して1になる」などの重要な条件がありましたが、連続確率にも同様に「重要な2条件」があります。 確率密度関数 f(x) の値は常に0以上 「取り得る値の全範囲」にわたって、確率密度関数 f(x) を積分すると1になる。つまり p(全範囲)=1 となる 重要なポイ

    第5回 正規分布[後編] | gihyo.jp
  • 第4回 正規分布[前編] | gihyo.jp

    今回と次回では前後編に分けて、統計においてもっともよく使われる確率分布である「正規分布」のお話をします。 第2回・第3回の復習 最初に、前回までのおさらいを簡単にしておきましょう。 まず確率を定義するものとして、確率変数 X と確率分布 p(X) を紹介しました。これが「確率」であるためには、以下の2つの重要な条件を満たしている必要がありました。 確率の値は0以上1以下 すべての取り得る値の確率の合計は1 これらの条件は、今後機械学習を学んでいく上で、常に意識しておかないといけません。今回も使いますよ。 それから、確率変数が複数ある場合の「同時確率」「⁠条件付き確率」「⁠周辺確率⁠」⁠、そして「事後確率」を導入し、「⁠確率の加法定理と乗法定理」という2つの定理と、「⁠ベイズの公式」を導きました。加法定理と乗法定理については、今回も使いますのでその時に確認しましょう。 最後に、「⁠条件付き独

    第4回 正規分布[前編] | gihyo.jp
  • 第3回 ベイジアンフィルタを実装してみよう | gihyo.jp

    さらに詳細な利用方法が知りたい方は、Yahoo!デベロッパーズネットワークのマニュアルを参照してください。 ベイジアンフィルタの実装 ここから格的にベイジアンフィルタの実装に入っていきます。 その前に、まずは先程のリスト1のコードを利用して入力された文章をわかち書きし、単語の集合を返す関数を作成しnaivebayes.pyとして保存しましょう。こちらも先程のmorphological.pyと同様にutf-8で保存してください。 リスト2 文章の分割をする関数(naivebayes.py) # -*- coding: utf-8 -*- import math import sys #yahoo!形態素解析 import morphological def getwords(doc): words = [s.lower() for s in morphological.split(doc)

    第3回 ベイジアンフィルタを実装してみよう | gihyo.jp
  • 第2回 確率の初歩 | gihyo.jp

    今回は、機械学習で使う「確率」のお話です。 確率は、統計的な機械学習のもっとも重要な基礎知識です。とはいえ、確率についてゼロから説明するというのは紙数的にも厳しいため、高校の確率を少し憶えているくらい(期待値や標準偏差など)を前提とし、「⁠高校の確率」と「機械学習の確率」の質的な相違点について、少し丁寧に見ていく、という形で進めていきます。 機械学習と確率 最初に、機械学習にとって確率はどういう役割なのかを確認しておきましょう。 実のところ、機械学習に確率が必須というわけではありません。ニューラルネットワークやサポートベクターマシンなどの有名な手法も「確率を用いない機械学習」ですし、その他にも数多くの手法があります。しかし、「⁠確率を用いない機械学習」の多くは、「⁠結果のランキングを作りづらい(評価値の大小に意味がない⁠)⁠」⁠「⁠条件が異なる場合の結果を比較できない」などの欠点がありま

    第2回 確率の初歩 | gihyo.jp
  • 第55回 確率の数学 正規分布 | gihyo.jp

    初めて戦う相手というのは、やりにくいものです。どこから手を付けたものか、判断の基準がありません。そんなときは、自分の得意な形と、考えられる限り最も一般的な手で始めてみるものです。必ずしもそれが当てはまるとは限りませんが、当てはまらなければ、どう当てはまらなかったかを観察し、戦略を切り替えて行けばよいのです。 今回学習する正規分布はそのような道具です。必ずしも全ての場合に当てはまる確率分布ではありませんが、山形の確率分布になる事象について一般的によく用いられるものです。これまでに学習した項目が総合的に用いられます。忘れてしまったところがあれば前に戻って復習しながら学習を進めてください。 図55.1 じっくり相手の出方を見よう 正規分布 正規分布[1]とは、図55.2のような形の確率分布で、確率密度関数は式54.1で定義されます。式中のmは期待値、σは標準偏差です。確率変数Xの値xは実数です。

    第55回 確率の数学 正規分布 | gihyo.jp
  • 第54回 確率の数学 連続事象の確率分布 | gihyo.jp

    柔道の背負い投げは、文字通り背負って投げることもあります。では、自分の力では持ち上げられないような重い相手には使えないのでしょうか。実は、背負い投げは、相手を背負う必要が無い技なのです。ぴったりと相手の正面に自分の背を付けるように技に入りますからこの名前が付いていますが、実際に力を働かせる場所は取り(技をかける側)の腰、おしりの少し上ぐらいです。受け(技をかけられる側)に力の働く場所は重心の少し下、へそと股ぐらの中間か、それより下の部分です。コツは受けの重心を前へ引き出すこと。そして、受けの重心の下へ自分の体を入れれば、ちょうど石に躓いてこけるような形になり、受けはくるりと回転します。うまくいけば重さをほとんど感じません。 この背負い投げのコツを、1つの公式的に教えることはできません。受けと取りの体格差によって千差万別、立つ位置も変化します。多くのコンピュータ・ゲームのように、このアイテム

    第54回 確率の数学 連続事象の確率分布 | gihyo.jp
  • 第53回 確率の数学 期待値・分散・標準偏差 [後編] | gihyo.jp

    前回は期待値・分散・標準偏差の定義と、具体的な計算方法を確認しました。今回はそのおさらいとして、数学的に各値を求めたあと、シミュレーションを行い、2つの場合の値を比較する問題に取り組みましょう。手で計算した結果とシミュレーションの結果は一致するでしょうか。それとも、一致は難しいでしょうか。 問題 5枚のコインを投げあげて、何枚表が出るだろうか。表の出る枚数を確率変数Xとし、確率分布、期待値、分散、標準偏差をそれぞれ求めましょう。 前回と同様、数学的に各値を求め、その後にシミュレーションプログラムを作成し、統計的に値を求めてください。 解説 問題 5枚のコインを投げあげて、何枚表が出るだろうか。表の出る枚数を確率変数Xとし、確率分布、期待値、分散、標準偏差をそれぞれ求めましょう。 数学的に各値を求める 先ずは数学的に計算してみましょう。 コインを1枚投げあげて表の出る確率は半分です。2枚のコ

    第53回 確率の数学 期待値・分散・標準偏差 [後編] | gihyo.jp
  • 第52回 確率の数学 期待値・分散・標準偏差 [前編] | gihyo.jp

    勝負事の世界では、一発狙いの勝負師もいれば、堅実に小さな勝ちを積み重ねていくタイプの勝負師もいます。柔道の世界に例えれば、一発狙いは大技で派手に勝ちたいタイプ。有効以上のポイントを積み重ね、あとは守りに徹し、チャンスがあれば合わせ技一を狙うのが堅実なタイプでしょう。もちろん、伝統的な柔道では一発の技を美しく決めることが推奨されますが、団体戦で格上の相手と当たり、何が何でも引き分け以上、負けられない試合では、見た目にはみっともない戦い方もやむを得ないことがあります。確率の数学で言うところの、引き分け以上の確率が最も大きいような戦い方をするのです。 今回学習するのは、そのような確率の活用に役立つ、期待値・分散・標準偏差といった、確率をより実際的に用いるための道具だてを紹介します。 図52.1 何が何でも引き分け以上を 期待値 期待値[1]とは、各事象の値、すなわち確率変数の値に確率を乗じて合

    第52回 確率の数学 期待値・分散・標準偏差 [前編] | gihyo.jp
  • 第51回 確率の数学 確率密度関数 | gihyo.jp

    ものごとは白黒はっきりさせたいものです。なんだかぼんやりしたものを見ると、落ち着かないし、不安にさえなってしまいます。理系の人々にはそんな傾向の人が多いように感じます。逆に文系の人々は、むやみに白黒つけるのを好まないように思われます。 伝統的な講道館柔道の試合は、実は文系的です。勝敗よりも大切にするものがあるからです。もちろん、勝敗は大切なのです。しかし、最優先ではありません。一番大切なのは「良い勝負ができたか」ということです。スポーツとしての格闘技は勝つことが目的ですから、わずかでもポイントで優勢に立てば逃げることも有効な戦術です。しかし、日柔道では尊ばれません。逃げて勝った者には、それ相応のレッテルが貼られます。このあたり、近年急速に国際化したスポーツ柔道には見られなくなってきた価値観です。日が近代化する中で嘉納治五郎が伝えたかったのは、このことだったはずです。 数学といえば、はっ

    第51回 確率の数学 確率密度関数 | gihyo.jp
  • 1