タグ

統計に関するroba4944のブックマーク (36)

  • 統計学を哲学する « 名古屋大学出版会

    内 容 統計学は実験や臨床試験、社会調査だけでなく、ビッグデータ分析AI開発でも不可欠である。ではなぜ統計は科学的な根拠になるのか? 帰納推論や因果推論の背後に存在する枠組みを浮き彫りにし、科学的認識論としてデータサイエンスを捉え直す。科学と哲学を架橋する待望の書。 【ALL REVIEWS】序章(抜粋) 目 次 序 章 統計学を哲学する? 1 書のねらい 2 書の構成 第1章 現代統計学のパラダイム 1 記述統計 1-1 統計量 1-2 「思考の経済」としての記述統計 1-3 経験主義、実証主義と帰納の問題 2 推測統計 2-1 確率モデル 2-2 確率変数と確率分布 2-3 統計モデル 2-4 推測統計の世界観と「確率種」 第2章 ベイズ統計 1 ベイズ統計の意味論 2 ベイズ推定 2-1 仮説の確証と反証 2-2 パラメータ推定 2-3 予測 3 ベイズ統計の哲学的側面 3-1

  • 『ダメな統計学』冊子PDFの公開|Colorless Green Ideas

    『ダメな統計学』表紙 現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』の冊子PDFに比べると、大幅に加筆されている。ページ数で言うと2倍以上になっている。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 『ダメな統計学

    『ダメな統計学』冊子PDFの公開|Colorless Green Ideas
  • 多変数の相関を可視化する方法メモ - 草薙の研究ログ

    自分のためのメモ。 因子分析したら因子分析の結果だけ,構造方程式モデリングしたらパス図だけ,そういうのはちょっと好かない。殆どの場合相関行列があればそういうのは再現できるし,相関行列だって上手に可視化したら,例えば因子分析くらいの見通しはつく。これは,研究報告の透明性というのにもつながる。 ただ論文には紙幅の都合があって,いつでも,というわけにはいかないけど。 とにかく多変数の相関行列に対応するようなデータの可視化について,Rを用いてメモしていく。自分ですぐ忘れてしまうから。 (スクリプトの中に不自然に半角スペースとか入っているのは,hatena記法と変に被るところを避けるため) 散布図行列(SPLOM) 一番てっとり早い方法。 まずRのデフォルト関数で「データフレーム形式」でデータを読み込む。 例えばエクセルからクリップボードにコピーした状態なら, dat<- read="" table

    多変数の相関を可視化する方法メモ - 草薙の研究ログ
  • 一般化線形モデル - 共立出版

    一般化線形モデルは、各種の統計的方法を、回帰を拡張した統一的な枠組みのもとで扱うもので、線形重回帰、分散分析、ロジスティック回帰、対数線形モデル(分割表の分析)、ポアソン回帰、ガンマ回帰などを含む。現在、さまざまな分野で広く使われ、多くの統計ソフトウェアが対応している。書では、フリーソフトウェアであるRを利用して、一般化線形モデルの基的な使用法を最尤法による検定や推定などを含めて解説するとともに、一般化線形モデルを実際の場面で使用する際に遭遇することの多い混合モデルやパラメトリック・ブートストラップ、擬似尤度などの手法を解説している。簡単な例題をRを用いて実際に解析しながら読んでいくことにより、尤度と最尤法の基的な考え方を身につけることができる。また、多くの統計ソフトウェアでは対応されていない特徴をもつデータや仮説に対して、一般化線形モデルを拡張して対応する方法も解説している。 第1

    一般化線形モデル - 共立出版
  • ログイン - はてな

    パスワードを忘れた方はパスワードの再設定を行ってください。 うまくログインできない方はお問い合わせをご覧いただき、Cookieの設定をご確認ください。

    ログイン - はてな
  • データマイニングで理想の彼女をGetだぜ! - 発声練習

    ある国際会議のkeynote Speechの中で紹介されていた話。非常に面白かった。 Wired: How a Math Genius Hacked OkCupid to Find True Love 「いまどきの若い男は、なんでもコンピュータか!」とか思われるかもしれないけど、何をしたのかを読んでみると「これって、単なるナンパの方が楽だったんじゃないか?」と思わされる。 登場人物のスペック この人の経歴がアメリカ的。 名前:Chris McKinlay (35歳) 経歴 2001年:Middlebury College を卒業。専攻は中国語 同年:世界貿易センターで中国語から英語への翻訳のアルバイト。アルバイトを辞めた5週間後に9・11。 〜2002年:その後、友達に誘われて、an offshoot of MIT’s famed professional blackjack team に

    データマイニングで理想の彼女をGetだぜ! - 発声練習
  • 100614 構造方程式モデリング基本の「き」

    StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~nocchi_airport

    100614 構造方程式モデリング基本の「き」
  • Millisecond

    INQUISIT Precision testing for psychological research Serving 3621 research institutions worldwide Cited in thousands of peer-reviewed articles Includes 807 customizable psychological tests Remote and In-Person Psychological Testing The Inquisit platform offers licensing options for local and online administration of cognitive and neuropsychological tests, assessments, and integration with neuroph

  • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

    今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

    統計的消去で擬似相関を見抜こう! - ほくそ笑む
  • はじめての「R」

    2023/02/06追記: slideshareが非常に使いづらくなってしまったため、speakerdeckに転載しました。 https://speakerdeck.com/masaha03/hazimeteno-r 補足記事を書きました。併せてご覧ください。http://m884.hateblo.jp/entry/2012/12/03/232431Read less

    はじめての「R」
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • 一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家

    久しぶりの投稿です。この一年間、Rの勉強会などに参加したり主催したりしてきて、後輩や勉強会の方々の話をいろいろ聞くとこができました。そんな中、一年間でRと統計学・機械学習を身に付けれるようなフローを作れるかも?と思ったので、ここで記録しておきます。統計学や機械学習は理論を勉強するだけでなく、Rで実際に解析してみることで、より理解が深まります。 ステップ1. 分布・検定 理論 統計学入門 (基礎統計学?) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メディア: 単行購入: 158人 クリック: 3,604回この商品を含むブログ (79件) を見る R Rによるやさしい統計学 作者: 山田剛史,杉澤武俊,村井潤一郎出版社/メーカー: オーム社発売日: 2008/01/25メディア: 単行購入: 64人 クリック: 782回この商品を含

    一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家
  • 社会学者の研究メモ

    社会を知るためには (ちくまプリマー新書) 作者:筒井淳也発売日: 2020/09/09メディア: 新書 (前回の続きです。は初学者向けですが、「補論」シリーズはそうではないかもしれないので、ご理解ください。) 社会の各部分の「噛み合わなさ」を考えるとき、私自身は以下のようなリストを思い描いている。(このリストはでは示していない。) 政策・プログラム:意図的な目的に沿った介入。 構造要因:経済(産業・職業・雇用)構造、人口構造、家族構成など。結果的にもたらされている状態。 価値観・態度:人々が望ましいと考える状態。 社会学や近隣分野では、しばしばこれらの要素の絡み合いによって「社会を記述」する。たとえば(第一次)人口転換の先の出生力の低下についていえば、「経済成長の鈍化と産業構造の変化が女性の労働力参加をもたらし、出生力の低下圧力がかかったが、男女均等の価値観の浸透もあり、両立支援政策

    社会学者の研究メモ
  • ロジスティック回帰でいろんな特徴関数を試す - 木曜不足

    ロジスティック回帰+確率的勾配降下法 - Mi manca qualche giovedi`? 前回に続いて、ロジスティック回帰で遊ぶ。 まだ線形の特徴量しか試していなかったので、二次項や RBF (距離に基づく特徴)も追加し、イテレーションももっとたくさん行うようにし、また初期値や学習順によって結果が変わるから、テスト自体も複数回行えるようにした。 そうなると、さすがに対話式インターフェースでコピペ実行というわけにもいかないので、スクリプトにて記述。 https://github.com/shuyo/iir/blob/master/lr/lr.r 分布図を吐かせるかどうか、テストを何回行うかはコマンドラインから指定できる。 R -q --vanilla --slave --args --chart -i 5 < lr.r --args の後に --chart を書くと分布図を出力し、-i

    ロジスティック回帰でいろんな特徴関数を試す - 木曜不足
  • サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ
  • Sifry's Alerts: The State of the Live Web, April 2007

    The State of the Live Web, April 2007 Hey, it's that time again, time to slow down, take a deep breath, and dig into the data! About this Report, and the Obligatory Plug for Technorati Technorati is known widely for its quarterly State of the Blogosphere reports, analyzing the trends around blogs and blogging. With this report, we expand on this tradition by introducing information and analysis re

  • データで学ぶ!統計活用授業のための教材サイト

    データセットや授業ワークシート等の教材がダウンロードできます。 また,道具箱のカテゴリには, 表計算ソフトの操作方法,マクロ,分析ソフト,解説テキストの ダウンロードや参考図書の閲覧も可能です。 右のテーマ一覧から必要なカテゴリをクリックしてください。 » 教材データ » 地理と人口(2) » 環境と自然(3) » 身近なくらしと生活(1) » 社会と産業・経済(6) » スポーツ(5) » 身体と健康(3) » 学校(2) » 生物(動物・植物)(1) » マネー(2) » 文化と芸術(1) » 確率(2) » 道具箱 » マクロ・分析ツール(13) » 解説テキスト(1) » 参考図書(0) » 教材提供者一覧 » リンク集・お問い合わせ » 統計教育推進委員会

  • クリック統計学に陥らない、とりあえず5つの方法 - 女教師ブログ

    クリック統計学をマスターする、ただ5つの方法 - 女教師ブログのB面クリック統計学エクセルや統計ソフトのボタンを「クリック!」することで統計解析を行う学問。最近の統計ソフトは、分析結果を提示する際に必要な係数や情報を、一回のクリックで一度に出力してくれる便利なものが多い。しかし、そうした便利さゆえ、「統計学とは何ぞや」ということをちっとも理解していないような、ひどい統計解析を行う立場。および、そうした立場を「統計はツールなんだし、数式なんて覚えなくていいじゃん」のように開き直る理論的態度。*1 1. 似た変数を統合する前に、単純集計・クロス表・グラフなどをつかって、「生データ」の特徴を徹底的に調べましょう。 たとえば、英語読解力、語彙力、発音の正確さ、流暢さなどが、すべて英語力に関係するものだからといって、それを統合していい理由は少しもありません。「似ている」「関係している」というのと、「

    roba4944
    roba4944 2009/07/26
    ポイントはここかしら?「ただ少なくとも言えることは、「何が必要な情報か」は、その分析の数理的意味がわかっていないとわからないということです。」
  • 統計的に正しいランキングを行う方法 - Hello, world! - s21g

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 ポジティブ/ネガティブ投票による正しいランキング方法が以下の記事で紹介されています。 How Not To Sort By Average Rating この計算方法では、投票数が少ない場合には分散が大きく不正確な評価で、 投票数が多くなるにつれて分散が小さく正確な評価が得られているという事を考慮しています。以下数式 これはScoreの信頼区間を表しています。 この信頼区間の下界をランキングのスコアにすれば良い事になります。 ここで、は、 です。全体に占めるポジティブ投票数の割合ですね。 は標準正規分布上の 信頼区間の有意確率です。 さて、五段階評価によるRatingに同様のテクニックを適用する場合はどうしたらいいでしょうか

  • ベイズを学びたい人におすすめのサイト - download_takeshi’s diary

    ベイジアンフィルタとかベイズ理論とかを勉強するにあたって、最初はなんだかよくわからないと思うので、 そんな人にお勧めのサイトを書き残しておきます。 @IT スパム対策の基技術解説(前編)綱引きに蛇口当てゲーム?!楽しく学ぶベイズフィルターの仕組み http://www.atmarkit.co.jp/fsecurity/special/107bayes/bayes01.html いくつかの絵でわかりやすく解説してあります。 自分がしるかぎり、最もわかりやすく親切に解説してる記事です。数学とかさっぱりわからない人はまずここから読み始めるといいでしょう。 茨城大学情報工学科の教授のページから http://jubilo.cis.ibaraki.ac.jp/~isemba/KAKURITU/221.pdf PDFですが、これもわかりやすくまとまってます。 初心者でも理解しやすいし例題がいくつかあ

    ベイズを学びたい人におすすめのサイト - download_takeshi’s diary