タグ

統計に関するyowaのブックマーク (68)

  • 確率と因果を革命的に架橋する:Judea Pearlのdo演算子 - Take a Risk:林岳彦の研究メモ

    皆さまこんばんは。今回から数回のあいだは、久しぶりに統計的因果推論ネタについて書いていきたいと思います。 今回の具体的なテーマは「Judea Pearlのdo演算子」になります。マニアックです。 このテーマについては自分でも完全に理解しているわけでは全くないので、「解説」というよりも「半可通が書いた公開勉強メモ」というかんじになりますが、その旨ご了承いただければ幸いです。 (*例によって今回もまためちゃくちゃ長いエントリーとなりますが、何卒よろしくお願いいたします。また、間違いなどがありましたらその旨ご指摘いただければ大変幸甚でございます>物の識者の方々) まえおき:Judea Pearlって誰すか? はい。ではそもそもその「Judea Pearlって誰すか?」というところから書いていきたいと思います。 結論から言うと私もよく知りません。ですが、周辺的手がかりからヒューリスティックに判断

    確率と因果を革命的に架橋する:Judea Pearlのdo演算子 - Take a Risk:林岳彦の研究メモ
    yowa
    yowa 2012/03/16
  • マルコフ連鎖モンテカルロ法の最近の展開 | CiNii Research

    JaLC IRDB Crossref DataCite NDL NDL-Digital RUDA JDCat NINJAL CiNii Articles CiNii Books CiNii Dissertations DBpedia Nikkei BP KAKEN Integbio MDR PubMed LSDB Archive 極地研ADS 極地研学術DB 公共データカタログ ムーンショット型研究開発事業

  • 浅野 晃の講義 - 応用統計学(2008年度前期)

    お知らせ レポートについて こちらの案内を見てください. 休講について 5月22日は,出張のため休講とします.以後の講義は1回ずつ後ろに繰り下げ,予備日を1日使用します.下のスケジュール表で確認してください. 講義室変更 第2回の講義(4/17)から,講義室をC709に変更します. 「学内用」の表示について 講義プリント・資料に「学内用」と表示されている場合は,広島大学内では自由に見ることができますが,広島大学の外で閲覧するには,受講生に通知したパスワードが必要です.これらのプリント・資料は,他の書籍のコピーであったり,他の書籍から引用した図を含んでいるため,アクセスに制限をつけています. 受講生は,「学内用」のプリントも印刷して持参してください. スケジュール以外のプリント 講義の案内 スケジュール

  • はてなブログ | 無料ブログを作成しよう

    トルコ水紀行 -前編 イスタンブール- みなさんこんばんは、地図子です!8月は久しぶりに毎月更新にしようと思います。今までずっと名古屋について書いてきましたが、ワープして・・・ トルコについて書きたいと思います。 2024年6月に念願のトルコに行ってきました。いつからトルコに行きたかったかわから…

    はてなブログ | 無料ブログを作成しよう
    yowa
    yowa 2010/06/24
  • あじブログ 駒落ちのレーティング差

    2024年08月 / 07月≪ 12345678910111213141516171819202122232425262728293031≫09月 私の3連勝を賭けた一番で、激指君はまた喧嘩を売ってきました。どう考えたって、これは無理攻めです。上手の銀も使いにくいし、こんな攻めで普通なんとかなる分けありません、きっと。▲6八金~▲1五歩~▲3八銀~▲2六歩~▲2七銀~▲3八金と万全の準備をしてから、桂馬を捕獲に行きました。なのに、完敗でした。これでもかというぐらい慎重に指したはずなのに、潰されました。悔しすぎます。これが激指の強さであり、私の弱さなんでしょうね。はぁ。先は長い。 またちょっとマニアックな記事を書きました。続きは【Read More・・・】をプチッとよろしく。 【More・・・】 駒落ちで対戦するときの棋力差の目安はどの程度になるのか、少し前から感心がありました。そこで思いつ

  • フラクタルビスケット、ポアソンスパゲッティ - 小人さんの妄想

    フラクタルの語源は 「ラテン語の動詞frangereは『壊れる』、すなわち不規則な断片ができるという意味」 なのだそうです。 >> http://www.biwa.ne.jp/~k-tochi/siryou/siryofra.html それでは、実際にものを壊したときの破片は、どのような大きさに散らばるのでしょうか。 岩石に衝撃を与えて破壊するとその破片の大きさの分布はベキ分布になることが知られています。 ガラスのコップを硬い床に落として割った時にできる破片も同じです。 大きな破片はほんの数個で、中くらいの破片はかなりの数になり、小さな破片は無数にあります。 -- 経済物理学の発見(光文社新書)より. 試しにやってみようと思ったのですが、岩石を割るのはたいへんだし、ガラスのコップを割るのはもったいない。 簡単に割れるものを探してみたところ、戸棚の中にビスケットがありました。 小袋の中に入っ

    フラクタルビスケット、ポアソンスパゲッティ - 小人さんの妄想
    yowa
    yowa 2009/12/14
    分布の実験。
  • 確率論、統計学関連のWeb上の資料 - yasuhisa's blog

    確率論と統計学は俺がまとめるから、他の分野はお前らの仕事な。 確率論 Index of /HOME/higuchi/h18kogi 確率空間 生成されたσ-加法族 確率の基的性質 確率変数とその分布 分布の例 分布関数 期待値、分散、モーメント 期待値の性質 独立確率変数列の極限定理 大数の弱法則(Weak Law of Large Numbers) 確率1でおこること 大数の強法則 中心極限定理 特性関数 Higuchi's Page Brown運動 Brown運動のモーメントの計算 連続性 Brown運動の構成:Gauss系として Brown運動に関する確率積分 空間L^2の元の確率積分 伊藤の公式(Ito formula) 日女子大学理学部数物科学科の今野良彦先生のところにあった資料 最尤法とその計算アルゴリズム 収束のモード 大数の法則と中心極限定理 指数分布族モデルにおける最

    確率論、統計学関連のWeb上の資料 - yasuhisa's blog
  • マンUが本拠試合で劣勢時、ロスタイムがより長いと 英紙(CNN.co.jp) - Yahoo!ニュース

    CNN) サッカーのイングランド・プレミアリーグ、マンチェスター・ユナイテッド(マンU)が拠地で劣勢の時、ロスタイムが優勢時よりも長いとする比較結果を、英紙ガーディアンが伝えた。ファーガソン監督率いるマンUが、試合の土壇場で得点する率が高いことを裏付ける結果だとしている。 ガーディアン紙は2006─07年シーズンから、マンUが拠地オールド・トラフォードで試合した際のロスタイムを調査。その結果、勝っていた48試合での平均ロスタイムは191.35秒だったが、引き分けもしくは敗れていた12試合では、平均ロスタイムが257.17秒だった。 2006─07年シーズンでは勝っていた15試合の平均ロスタイムは194.53秒で、劣勢だった4試合の平均ロスタイムは217.25秒。これが2007─08年シーズンでは、優勢な試合では平均178.29秒だったが、劣勢時には254.5秒と差が大きかった。2

    yowa
    yowa 2009/09/24
  • 人口とGDP - himaginary’s diary

    ちょうど1年前に、実質GDPと消費や投資との散布図を描いて、90年以降の日経済が壁にぶつかったような動きをしていることを示した。今度は、GDPと人口の関係を見てみようかと思う。 今回、人口と経済の関係を改めて考えてみようと思った理由は、以前書いたように、日の場合、やはり問題の根源は人口減にあるのではないか、という問題意識が元々あったのに加えて、人口増こそデフレ脱却の正攻法というJBPressの上野泰也氏の論説を読んだことや*1、高齢化による今後の一層の財政悪化を憂う岩康志氏のブログエントリを読んだことによる。 まず、名目GDPと人口の関係を見てみよう。 (ここで実質ではなく名目の方を最初に取り上げるのは、8/19エントリで書いたように、現下の状況では、名目GDPならびにその成長率こそ経済指標として相応しいのではないか、と小生が最近考え始めたことによる。また、岩氏の前のエントリに8/

    人口とGDP - himaginary’s diary
    yowa
    yowa 2009/09/20
  • 日本国民の1.46%がニコ厨・・・? - はん(highemerly)の日記。

    先日、ニコニコ動画内で、ニコ割アンケートを使った「第45回衆議院議員総選挙 ネット入り口調査」が実施されました。 第45回衆議院議員総選挙 ネット入口調査 実はこのアンケートには問題が多い*1と思われるのですが、今回はその話ではありません。 なんとなんと、ニコ割アンケートの結果の中に、「各選挙区ごとのアンケートに回答した人数」が書かれているではありませんか。このデータと、日の人口分布のデータを組み合わせれば、各地域ごとの「ニコニコ動画のアクティブユーザー率」が計算できますね! ということでやってみたよ! 調査方法 アンケートに解答した人数は、公開されているアンケート結果(文献[1])から手入力でがんばって取得しました。*2この人数は、20代・30代・40代の回答者だけをカウントしているとのことです。ですので、平成17年に実施された国勢調査から、各都道府県の20才〜49才の人口を得て、それ

    日本国民の1.46%がニコ厨・・・? - はん(highemerly)の日記。
  • クリック統計学をマスターする、ただ5つの方法 - 女教師ブログ

    クリック統計学エクセルや統計ソフトのボタンを「クリック!」することで統計解析を行う学問。最近の統計ソフトは、分析結果を提示する際に、必要だと“言われている”係数や情報を、一回のクリックで一度に出力してくれる便利なものが多い。そうした技術的革新に敬意を払い、それらをそのまま報告書や論文に貼り付ければ、思考や紙の節約になって、とても良いことであると考える理論的立場。*1 1. とりあえず、似たような変数はすべて足し合わせなさい たとえば、英語読解力、語彙力、発音の正確さ、流暢さなどはすべて英語力に関係するものですから、構わず足し合わせましょう。それらを個別に、ちまちまと検討するのは紙と時間と思考の無駄遣いです。みんな似ているのですから、足していいのです。あるいは、「国語力」や「コミュニケーションへの積極さ(外向的性格)」なども、たぶん、英語力に関係しているはずですから、必要ならば足してしまいま

    yowa
    yowa 2009/07/27
     ワロタ。/かなり分かりやすく書かれてると思うのに、それでもマジ解説エントリが必要になるのか……。
  • クリック統計学に陥らない、とりあえず5つの方法 - 女教師ブログ

    クリック統計学をマスターする、ただ5つの方法 - 女教師ブログのB面クリック統計学エクセルや統計ソフトのボタンを「クリック!」することで統計解析を行う学問。最近の統計ソフトは、分析結果を提示する際に必要な係数や情報を、一回のクリックで一度に出力してくれる便利なものが多い。しかし、そうした便利さゆえ、「統計学とは何ぞや」ということをちっとも理解していないような、ひどい統計解析を行う立場。および、そうした立場を「統計はツールなんだし、数式なんて覚えなくていいじゃん」のように開き直る理論的態度。*1 1. 似た変数を統合する前に、単純集計・クロス表・グラフなどをつかって、「生データ」の特徴を徹底的に調べましょう。 たとえば、英語読解力、語彙力、発音の正確さ、流暢さなどが、すべて英語力に関係するものだからといって、それを統合していい理由は少しもありません。「似ている」「関係している」というのと、「

    yowa
    yowa 2009/07/26
  • 代表秘書の逮捕より深刻、民主党が抱えるある問題:日経ビジネスオンライン

    政権前夜を迎えたはずの民主党に新たな問題が浮上した。小沢一郎代表の公設第1秘書の逮捕もさることながら、肝心な経済政策が民意と大きく乖離していることが日経ビジネスの調査で明らかになった。 日経ビジネスは今年1月から2月にかけて、全衆院議員480人と上場企業の会長・社長、日経ビジネスオンラインの読者を対象に「第2回 経済政策アンケート」を行った(下図参照)。 >>>図の左側を拡大する    >>>図の右側を拡大する このアンケートは、日経済が復活するためにどのような政策が必要かについて、17の質問で聞いたものだ。衆院議員で回答があったのは147人。質問のうち、具体的な政策内容を聞いた15問について、彼らの回答をクラスター分析(類似度を数値化し、近いものを集めて集団を作る)という方法で分類したところ、政党の枠を超えた4つの集団ができあがった。これを仮にA党、B党、C党、D党と名づけた。 上の図

    代表秘書の逮捕より深刻、民主党が抱えるある問題:日経ビジネスオンライン
    yowa
    yowa 2009/03/13
    政治家へのアンケートをクラスター分析。おもしろい。
  • ランキングデータ(都道府県市区町村)

    人口は、各都道府県が公表している、2023年(令和5年)10月1日の推計人口によります。推計人口とは、2020年(令和2年)の国勢調査人口を基に、住民基台帳法に基づく届出を加減することにより算出した人口であり、外国人を含んでいます。ただし、北海道については推計人口を公表していないため、国勢調査人口と住基ネット人口から、当サイトで推計人口を独自に計算しています(協力:白桃市町村人口研究所)。 面積は、2023年(令和5年)7月1日の国土交通省国土地理院「全国都道府県市区町村別面積調」によります(単位:km2)。北海道の面積および根室振興局(旧根室支庁)の面積には北方地域(歯舞群島、色丹島、国後島、択捉島)の面積は含めていません。また、根室市の面積には歯舞群島の面積は含めていません。人口密度は、小数点以下第3位を四捨五入しています(単位:人/km2)。 人口は、国勢調査人口を基にした実数によ

    ランキングデータ(都道府県市区町村)
    yowa
    yowa 2009/03/06
  • 2008-02-11 - ハリ・セルダンになりたくて  まぐれ―投資家はなぜ、運を実力と勘違いするのか

    [要約] ナシーム・ニコラス・タレブ「まぐれ―投資家はなぜ、運を実力と勘違いするのか」はランダム性を学ぶのに最適。啓蒙書を読むことはほとんどない人生。読むべきはおっさんどもではなくて高校生など若い人たち。規則の逸脱。20年前の田舎の高校生。偶然であるがゆえに連続す。モンテカルロ法な話。乱数と低い違い列。そして、推薦の言葉 [規則の逸脱] 僕は、普段は、啓蒙書を書評したりは(あまり)しない。時折、知り合いに啓蒙書を書いて、僕に献してくれる人がいるのだが、それらのほとんどをblogで取り上げたことがない。 それは意地悪をしようとかそういう意図はなく、僕が「ほとんど啓蒙書を読まない」からだ。僕が啓蒙書を読むのはよっぽど何かあった時だけだ。雷に打たれて神の啓示を得たとか、他人の名前を書くとその人が死んでしまうノートを拾ったとか、ライトセーバーを持った黒いヘルメットに黒マントの大男に「私がお前の

    2008-02-11 - ハリ・セルダンになりたくて  まぐれ―投資家はなぜ、運を実力と勘違いするのか
    yowa
    yowa 2009/01/07
    > 「乱数は乱数であるがゆえに、集まることがある」 「そして、集まることは単に偶然であって意味はない」
  • 統計学入門

    さて皆さん、「数字は魔物、統計は数字のトリック」などと言われ、統計学はある人々からは疫病神のように忌みに嫌われ、またある人々からは金科玉条のごとく無条件に信奉され、はたまた別の人々からは塵芥のごとく無視されています。 しかしやかましくいわれている割には、その質が十分理解されているとはいい難いのが現状ではないでしょうか? 研究現場の研究者が統計手法を利用する時に犯す間違いのうち、ほぼ90%のものが非常に初歩的なものです。 そしてそれらの間違いは研究者が統計学の基的な事柄をはっきりと理解していないか、あるいはそれらを誤解していることが原因になっています。 例えば研究現場でしばしば間違って使われている統計手法のベスト3は次のようなものです。 有意確率(p値)と「有意差あり」の意味 標準偏差(SD)と標準誤差(SE)の使い分け 多重比較の使用方法 これらは全て非常に初歩的かつ基的なことです。

    yowa
    yowa 2008/10/29
  • 針を落とせば円周率 :: デイリーポータルZ

    それを使うと円の面積や周が出せるという、なんだか不思議な魅力を持った円周率。多くの人はその理由も知らずに「π≒3.14」という風に暗記するしかなかっただろう。いわば与えられた円周率だ。 自力で円周率を求めようとしても難しい計算をしなければいけないと思っていたのだが、なんと頭をほとんど使わないでもできる方法があるらしいのだ。 その方法は、紙の上に針を落とすだけ。 (text by 藤原 浩一) ビュフォンの針 まずそのやり方を説明しようと思う。「ビュフォン(Buffon)の針」というものだ。 ・ 等間隔の平行線をたくさん書く ・ 間隔の半分の長さの針を落とす ↓ ・ 平行線と針が交わる確率は 1/π! えー何で? という感じだ。ところが、面積と確率を関係づけることで比率が出てくるものなんだという…。 感覚としてはこんな感じだろうか。例えばこんな色分けした図形の上に、ボールを100個落とす試み

    yowa
    yowa 2008/10/01
  • asahi.com(朝日新聞社):プロ野球の「通説」は錯覚? 名大教授ら846試合分析 - 社会

    プロ野球の「通説」は錯覚? 名大教授ら846試合分析2008年9月25日3時3分印刷ソーシャルブックマーク 「チャンスを逃すとピンチあり」「大量得点をした次の試合は打てない」。野球の世界でよく聞く話だ。こうした「通説」は当なのか。名古屋大の加藤英明教授(金融経済学)らがプロ野球の試合を分析したところ、実際とはずれがあることが分かった。 加藤教授らは、05年の全公式戦846試合のデータから検証した。 たとえば、走者が二塁以上に進んだチャンスがあったのに得点できなかった場合、その球団が直後の守備回に失点する確率は26.4%(平均失点0.492点)だった。全体の平均(26.4%、0.495点)とはほとんど差がなかった。 全試合のうち、10点以上の大量点があったのは145試合だった。その球団は次の試合でも平均4.87点を取っていて、全試合の平均4.43点を上回っていた。 無死満塁の場合の得点確率

  • 人間はどこまで速く走れるか:既存の理論を覆す「ボルト選手の世界新記録」 | WIRED VISION

    人間はどこまで速く走れるか:既存の理論を覆す「ボルト選手の世界新記録」 2008年8月27日 サイエンス・テクノロジー コメント: トラックバック (1) Alexis Madrigal 北京オリンピックの陸上男子100メートルでは、ジャマイカのウサイン・ボルト選手が世界記録を更新した。しかし、それに劣らず驚異的なのは、9.69秒というそのタイムも、生物統計学者が人体の自然な限界として予測する数値にはまだまだ届かないということだ。 ただし、ボルト選手は、ほぼ1世紀にわたり100メートル走の記録データに適合していた数学モデルを突き崩した。そのため、同選手の信じられないような成績は、究極的に人間がどのくらい速く走れるのかという問題について、研究者たちの考えを改めさせる可能性がある。 「この傾向は、単純曲線に逆らうように見える」と、大阪府立大学名誉教授の多幡達夫氏は、私設のデータ評価解析研究所(

  • 精度・再現率の罠 - まさおのChangeLogメモ / 2007-10-30

    myrmecoleonさんの反省文を読んで、率直に情報検索評価研究の勘所だな あと思う部分が含まれていたので、無粋に補足コメントを。 http://d.hatena.ne.jp/myrmecoleon/20071024/1193239434 http://d.hatena.ne.jp/myrmecoleon/20071029/1193665043 そもそも精度・再現率(Precision, Recall)は「数字」による表現だか ら「客観的」(なものだ|のように見える)という誤解は根強いのです。 しかし、これらはそもそもが判定者の主観に頼る数値であるという大前提 があるし、値そのものにも意味はそれほど無いので、要注意。 一般論を言えば、特に文書群が均一でなかったり、対象コンテンツが同一 でないものを比較する場合には、数値的な比較をおこなってはいけません。 私がNTCIRプロジェクトに関わっ

    yowa
    yowa 2007/10/31
    > 一般論を言えば、特に文書群が均一でなかったり、対象コンテンツが同一 でないものを比較する場合には、数値的な比較をおこなってはいけません。