タグ

statisticsに関するtoshi123のブックマーク (17)

  • いつからその方法で偏りのない乱数が得られると錯覚していた? - アスペ日記

    私はつい最近まで勘違いしていました。 ここのページに書いてあるような方法で、一様分布する整数が得られると。 int random(int n) { return (int)(( rand() / (RAND_MAX + 1.0) ) * n); } この方法、一見すると実に一様分布が得られそうに見えるんですよね。 どういう思考回路を通っているかというのを自己分析すると、次のような感じです。 1. rand() では 0〜RAND_MAX のランダムな整数が得られる。 2. それを RAND_MAX + 1 で割ると、[0, 1) に一様分布する実数が得られる。 3. [0, 1) の一様な実数を n 倍して小数点以下を切り捨てたら、0 から n-1 に一様分布する整数が得られる。 これの罠なところは、1 と(特に)3 が正しいというところだと思います。 ただ、2 がダウト。 思いっきりダウ

    いつからその方法で偏りのない乱数が得られると錯覚していた? - アスペ日記
    toshi123
    toshi123 2013/08/19
    乱数の話がいつも魅力的なのはなぜだろうか
  • R言語プログラミング: クラスター分析 - 階層的クラスタリング - hamadakoichi blog

    第2回データマイニング+WEB勉強会@東京の「はじめてでもわかる R言語によるクラスター分析」の内容に関する、ソースコードも以下に記載します。 ※記載しているソースは、R Console上や EclipseでR-Scriptとして、貼り付けそのまま実行可能です。(Rのインストール・環境設定はこちらで、RをEclipseで実行するための方法はこちら) 講義の全体内容・構成は次をご覧下さい。 ・R勉強会: 第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining) を開催しました - 「はじめてでもわかる R言語によるクラスター分析- ・Slideshare:はじめてでもわかる R言語によるクラスター分析 クラスター分析と評価 エントロピー(Entropy)と純度(Purity)の算出関数 #関数:エントロピー(Entropy)算出, ct:クロス集計表 calcEntr

    R言語プログラミング: クラスター分析 - 階層的クラスタリング - hamadakoichi blog
  • RによるHeatmapグラフの作成 - 霧笛望のもったいない開発保管庫

    手順距離関数Dist()で類似度を求め、hclust()でクラスタリングし、heatmap()のColv,Rowvオプションにdendrogram()を指定して出力する。プログラム例 library(amap) # Heatmapグラフ作成 # # ファイルの読み込み data <- read.table("test.txt", header=TRUE, row.names=1, sep="\t") # # PDFに出力する pdf() # # 距離関数で類似度のアルゴリズムとしてCosine係数を使用する # (method="pearson")は(1 - cosine)と同義である d1<-Dist(data, method="pearson") d2<-Dist(t(data), method="pearson") # # クラスタリングでAverage Linkageを使用する c

    RによるHeatmapグラフの作成 - 霧笛望のもったいない開発保管庫
  • 福島原発のγ線量測定データをggplot2で可視化してみた - ぬいぐるみライフ?

    東京電力が福島原発周辺におけるγ線量などの測定データをPDFで随時公開しているが,これを奥村先生がCSV形式に加工して配布なさっている. http://oku.edu.mie-u.ac.jp/~okumura/stat/data/ このデータをRのggplot2ライブラリで可視化してみた. CSVデータの特徴 各CSVファイルは以下のような形式になっている. $ head fukushima1.csv 【別紙】福島第一原子力発電所モニタリングカーによる計測状況,,,,,,,,, 計測日,計測時間,計測場所,γ線,中性子線,風向,風速(m/s),,, 3月11日,午後5時30分,体育館付近,49nGy/h,-,-,-,,, ,午後5時40分,正門付近,56nGy/h,-,-,-,,, ,午後5時50分,管理棟,64nGy/h,-,-,-,,, ,午後6時45分,MP-6,56nGy/h,-,

    福島原発のγ線量測定データをggplot2で可視化してみた - ぬいぐるみライフ?
  • マルコフ連鎖モンテカルロ法入門-1

    ※ここで解説しているお天気推移モデルはオリジナルなものですので、数値・計算等にミスがある可能性が否めませんので、もし間違いを見かけた方は優しく教えていただけると助かります。 お天気推移モデルで理解するマルコフ連鎖モンテカルロ法。2状態離散モデルの解説を中心に、メトロポリス法の解説まで行った。 次は連続モデルや熱浴法・メトロポリスヘイスティング法の解説資料も作成したい⇒完成。以下のLINKを参照下さい。http://www.slideshare.net/teramonagi/ss-5344006 誤字を修正(2010/11/01)Read less

    マルコフ連鎖モンテカルロ法入門-1
  • Sensitivity and specificity - Wikipedia

    Sensitivity and specificity - The left half of the image with the solid dots represents individuals who have the condition, while the right half of the image with the hollow dots represents individuals who do not have the condition. The circle represents all individuals who tested positive. In medicine and statistics, sensitivity and specificity mathematically describe the accuracy of a test that

    Sensitivity and specificity - Wikipedia
  • http://www.bi.a.u-tokyo.ac.jp/~tak/index.html

  • 確率論、統計学関連のWeb上の資料 - yasuhisa's blog

    確率論と統計学は俺がまとめるから、他の分野はお前らの仕事な。 確率論 Index of /HOME/higuchi/h18kogi 確率空間 生成されたσ-加法族 確率の基的性質 確率変数とその分布 分布の例 分布関数 期待値、分散、モーメント 期待値の性質 独立確率変数列の極限定理 大数の弱法則(Weak Law of Large Numbers) 確率1でおこること 大数の強法則 中心極限定理 特性関数 Higuchi's Page Brown運動 Brown運動のモーメントの計算 連続性 Brown運動の構成:Gauss系として Brown運動に関する確率積分 空間L^2の元の確率積分 伊藤の公式(Ito formula) 日女子大学理学部数物科学科の今野良彦先生のところにあった資料 最尤法とその計算アルゴリズム 収束のモード 大数の法則と中心極限定理 指数分布族モデルにおける最

    確率論、統計学関連のWeb上の資料 - yasuhisa's blog
  • http://www.yomiuri.co.jp/science/news/20080214-OYT1T00526.htm

    toshi123
    toshi123 2008/02/15
    時間はかかっちゃったけど、こうしてより良い統計がでることはいいことだね。厚労省もこれをきっかけに再検証してもっと良くなればいいわけだし。突っぱねたら最悪だけど。
  • 統計処理ソフト R 入門 講習会資料

    講習会の目的 講習会は, R についての自習の基盤をつくることを目指します。 たとえ初心者向けの数時間の入門講習でなく1年間の毎週の演習授業であっても,R に関してすべてを説明するのは不可能だと思われます。 R の世界は,縦にはそこそこ深く,横には果てが見えないほど広いです。 CRAN に登録されている R のパッケージは 1000 を超えました。 よって,受講者の幅も広いことですし,受講者各自にとってぴったりな統計解析の実用的な解説をするのはあきらめて, 各自が必要に応じて情報を探し,見つけたものを難なく活用できるようになること,を目標にしました。 ここに自分の求めている分析手法や作図法などの答えがあるとは期待しないで下さい。それは帰ってからのあなたの楽しい仕事です。 R の利用と R 言語 R の根幹は R 言語のインタプリタであり,ユーザはR言語を駆使することでRを操作します。 S

    toshi123
    toshi123 2008/02/11
    今度こそ勉強する。
  • Twitter、何人 Follow してる?

    ふと思い立って、Twitter で平均的なユーザー(アクティブユーザー)は何人ぐらい Follow してるのかを調べてみることにしました。ちなみに僕(akihito)は現在162人。積極的に Twitter を活用している人々に比べれば、決して多くはない数ですが、果たして「平均(特定のコミュニティの周辺に偏らない、という意味で)」はどうなんだろう?と気になった次第。 【方法】 最初は Public Timeline に現れる人々をチェックしようかとも思ったのですが、 どうも日人と外国人では傾向に差があるような印象を受ける ある一瞬の更新を拾うだけでは、更新頻度の高いユーザーばかりを抽出してしまう結果になるかもしれない と思い、以下の方法に切り替えました: ユーザー検索で「Japan」をキーワードに検索し、ヒットしたユーザー(9,636人)の中で、日語で更新している人を対象にする ただし

    Twitter、何人 Follow してる?
  • http://kerolin.jspeed.jp/Computer/Linux/toukei061029.html

  • EXCELを使った多変量解析

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

    toshi123
    toshi123 2006/03/25
    Excelのファイルを見られるので、プログラムの参考に。
  • http://case.f7.ems.okayama-u.ac.jp/statedu/term/

    toshi123
    toshi123 2006/03/25
    カテゴリ分けがあって使いやすそう
  • シミュレーションを活用した統計学教育教材の研究

    Since 2003/10/10 All:/ Today:/ Yesterday: ログ Project CASE Computer Assisted Statistical Education(CASE) このページは2002年度(平成14年度)に始まった科研費・特定研究 理数科系教育での一研究課題「シミュレーションを活用した統計学教育教材の研究」のためのページです。 これで作成した教材等は "CASE" プロジェクトの成果として、このホームページで公開していきます. 開発計画や成果を掲載していきますが、開発中のものも掲載していますので、随時、最新版をダウンロードして下さいますよう、お願いします。 プラグインなど必要なソフトウェア マルチメディア プロジェクトCASE2003紹介ビデオ プロジェクトCASE2002紹介ビデオ 部品(主にシミュレー

    toshi123
    toshi123 2006/03/25
    統計学のお勉強
  • 統計学自習ノート

    多変量解析 回帰分析(あてはめ),判別分析,主成分分析,因子分析, SEM 数量化 I 類,数量化 II 類,数量化 III 類,数量化 IV 類 正準相関分析,クラスター分析,主座標分析 クロンバックの $\alpha$ 信頼性係数 生存率解析 Cutler-Ederer 法による生命表,Kaplan-Meier 法による生命表 多重ロジスティックモデル,Cox の比例ハザードモデル

    toshi123
    toshi123 2006/03/25
    プログラムを書くために。
  • gr.jp

    This domain may be for sale!

    toshi123
    toshi123 2005/12/29
    多変量解析の項をチェック。 医学系ではないが役に立つ。
  • 1