タグ

統計に関するillmaiのブックマーク (34)

  • 「集団寄与危険割合」って何?疫学指標まとめ。 - NATROMのブログ

    疫学指標はたくさんあってややこしい。相対危険、寄与危険ぐらいまではおぼろげながら理解しているつもりだけど、「集団寄与危険割合(人口寄与危険割合)」とは何か、と聞かれてもすぐには出てこない。 私がアンチョコにしているのは、「基礎から学ぶ楽しい疫学 第2版」の表。数式ではなく、具体的な数字で示されているのでわかりやすいと思う。 「基礎から学ぶ楽しい疫学 第2版」より引用 相対危険(relative risk)が一番目にすることが多い指標であろう。「タバコを吸っている人は肺癌になる確率が5倍である」というやつ。タバコと肺癌に相関関係がないなら相対危険は1になるし、タバコを吸う人が肺癌になりにくい場合は相対危険は1より小さくなる。 寄与危険(attributable risk)は「曝露群と非曝露群の疾病頻度の差」をいう。私の理解では、個人がある特定の曝露を避けるかどうかを判断するには、相対危険より

    「集団寄与危険割合」って何?疫学指標まとめ。 - NATROMのブログ
  • 判別分析

    Excelを用いた判別分析 判別分析とは ○ 所属する群を推定するのが判別分析 どの群に属しているかが分かっている標があるときに,まだ分類されていない標がどちらの群に属するかを推定する手法を判別分析という. (判別に当たって重視されている要因を分析することにより結果に生かすこともできる.) ○ 量的変数→質的変数 判別分析は,目的変数が質的変数,説明変数が量的変数となる多変量解析であるが,説明変数が質的変数である場合もダミー変数を用いることにより同様に取り扱うことができる. ※ 判別分析の利用例 各種の検査項目から,ある病気であるかないかを判別する. 各種アンケート結果から各々の消費者が,製品Aを選ぶか製品Bを選ぶかを予測する. 筆記試験,面接,作文,適性検査など多面的な試験項目からなる入社試験,入学試験において合格群と不合格群を判別する. 文学作品における名詞や助動詞などの使用頻度

  • 確率・統計 (17) ベイズの定理(Bayes' Theorem)

    今まで紹介してきた確率論や統計学では、ある事象が発生する確率は変化することはないという立場をとってきました。例えば、サイコロを投げて出た目を確率変数とした時、100 回投げて全てが 1 の目であったとしても、サイコロに何も細工がされていなければ、それは偶然におこった事象で、1 の目が出る確率は相変わらず 1 / 6 のままです。100 回も 1 の目が続いたのだから、次も必ず 1 であろうと予想できなくもないですが、あくまでも客観的な立場をとるというのが今までの統計学での考え方です。それに対し、今までの結果を踏まえて確率そのものが変化するという立場を取る考え方を採用したのが「ベイズ統計学(Bayesian Statistics)」です。ベイズ統計学の立場では、1 の目が 100 回出たのだから、1 の目が出る確率もそれだけ大きくなっているだろうと判断することになります。今回は、ベイズ統計学

  • http://applied.bpe.agr.hokudai.ac.jp/education/measurement/02.pdf

    illmai
    illmai 2013/01/09
    最小二乗法 修正トンプソンτ法 ニュートン・ラプソン法
  • 統計学入門−第11章

    11.2 生存率の比較方法 (1) 累積生存率の比較 第1節の図11.1.1または図11.1.2を見ればA群の方が生存率が高い、つまりA法という手術の方が予後が良いことが直感的にわかります。 でも有意症患者は、 「2群の生存率に差があるかどうか検定したい!」 と言い出すでしょう。 そこで有意症患者のためにいくつかの手法が考案されているので紹介しましょう。 最も単純なものは、ある時点の累積生存率をそのまま群間比較する方法です。 第1節の表11.1.2と表11.1.3に記載されているように、ある時点の累積生存率について標準誤差を計算することができます。 この標準誤差と、累積生存率が近似的に正規分布することを利用すれば、対応のない2標の平均値の差を検定する手法と同じ原理で、ある時点における2群の累積生存率の差の検定と推定を行うことができます。 (→3.3 2標の計量値 (2) データに対応が

  • 図録▽在日外国人の人口ピラミッド

    法務省の在留外国人統計により日に住む外国人について調べてみよう。同統計は国籍別の在留外国人について男女年齢別の人数を掲載している。ここでは、これを利用し、人数の多い中国人、韓国・朝鮮人、ブラジル人、フィリピン人、ベトナムの人口ピラミッドを描いた。国籍別の人数推移や日に来た経緯などについては図録1180でふれているので参照されたい。 国籍別にそれぞれ非常に異なる男女・年齢別の特徴をもっている点が目立っている。 ニューカマーの多い中国人は20歳代~30歳代前半の男女が非常に多くなっている。男より女の方が多い。子連れは比較的少なかったが最近増えている。 戦前からの特別永住外国人が多い韓国・朝鮮人では、男女とも、全年齢層にわたっている点が他の外国人と異なる。15歳以下はやや少なくなっているが、在日2世、3世、4世とだんだん日の国籍取得も多くなっている影響だと思われる。 日系人が中心のブラジル

  • 平成23年2月 来日外国人犯罪の検挙状況 (平成22年暫定値) 警察庁刑事局組織犯罪対策部 国 際 捜 査 管 理 官 凡 例 ○ 本資料における「来日外国人」とは、我が国に存在する外国人

    平成23年2月 来日外国人犯罪の検挙状況 (平成22年暫定値) 警察庁刑事局組織犯罪対策部 国 際 捜 査 管 理 官 凡 例 ○ 資料における「来日外国人」とは、我が国に存在する外国人のうち、いわゆる定着居住者(永住 者、永住者の配偶者等及び特別永住者)、在日米軍関係者及び在留資格不明者を除いた外国人をいう。 ○ 資料中の特別法犯に係る「検挙件数」、「検挙人員」は、それぞれ送致件数、送致人員である。 ○ 資料中の「中国」については、別に断りのない限り「台湾」「香港等」を含まない。 ○ 資料中の「中国(香港等)」とは、中国国籍を有する者のうち、香港特別行政区又はマカオ特別 行政区が発給する旅券並びに中国、香港特別行政区又はマカオ特別行政区を除く政府(シンガポール、 マレーシア等)が発給した身分証明書等を所持する者をいう。 ○ 資料中の構成比について、四捨五入の関係で、合計数値と

    illmai
    illmai 2011/11/14
    来日外国人犯罪の検挙状況(平成22年確定値)
  • https://www.npa.go.jp/archive/toukei/keiki/h22/h22hanzaitoukei.htm

  • 法務省

  • カーネル法 正定値カーネルを用いたデータ解析

    1 2004 11 24~26 Final version. Nov.26, 2004 2 I 1. 2. � � 3. � � PCA CCA . � � Bochner � representer 3 II 5. � � � ICA, 7. 4 g(x) Parzen window ∑ = − = N i i x x g N x p 1 ) ( 1 ) ( 5 1. � 6 � ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = N m N m m X X X X X X X L M M L L 1 2 2 1 1 1 1 m N 7 x1 x2 z1 z3 z2 ) 2 , , ( ) , , ( 2 1 2 2 2 1 3 2 1 x x x x z z z = 8 � xi Φ(xi) zi H Ω H Ω H → Ω Φ : 9 � H = feature space

  • 多変量解析おすすめフリーソフト - 小人さんの妄想

    「多変量解析を、ちょっと試してみたいのですけど、何か良いフリーソフトないですか?」 そんな人におすすめしたいのが >> College Analysis です。 * 社会システム分析ソフトウェア -- College Analysis Ver.4.0 >> http://www.heisei-u.ac.jp/ba/fukui/analysis.html 福山平成大学の福井正康先生が、1人でコツコツ作り上げたソフトウェアで、 基統計、多変量解析の他、OR、意思決定支援、おまけにカオス・フラクタルの表示まで付いています。 開発過程を見ると、実際に授業で使われたソフトウェアの集大成になっているようです。 システムの利点: * 教育経験に基づいているので、求めたいものへ簡単にたどり着ける。 学生が戸惑わないように、できるだけ一発解答を心がけています。 * 無料である。 これはフリーソフトです。ご

    多変量解析おすすめフリーソフト - 小人さんの妄想
  • SVM-Light: Support Vector Machine

    SVMlight Support Vector Machine Author: Thorsten Joachims <thorsten@joachims.org> Cornell University Department of Computer Science Developed at: University of Dortmund, Informatik, AI-Unit Collaborative Research Center on 'Complexity Reduction in Multivariate Data' (SFB475) Version: 6.02 Date: 14.08.2008 Overview SVMlight is an implementation of Support Vector Machines (SVMs) in C. The main featu

  • https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.64.4209&rep=rep1&type=pdf

    illmai
    illmai 2011/05/24
    SVMの実装方法
  • SVMソフトウェアの比較 - tsubosakaの日記

    オープンソースのSVMソフトウェアの基デフォルトの設定で比較などをしてみた。 利用データはLIBSVM Data: Classification, Regression, and Multi-labelのa9aとnews20.binaryを利用した。 データセットの詳細は以下のようになっている データセット名 訓練データ数 テストデータ数 データの次元 a9a 32561 16281 123 news20.binary 15000 4996 1355199 なお、news20.binaryでの訓練データとテストデータの作成については id:n_shuyoさんの記事を参考にした。 比較に用いたソフトウェアは以下の5つ LIBSVM リンク SVM-Light リンク TinySVM リンク SVM-perf リンク LIBLINEAR リンク 測定結果は以下のようになった。パラメータの設定

    SVMソフトウェアの比較 - tsubosakaの日記
  • Wakahara

    Project Welcome_to_Wakahara_Project.pdf Introduction_to_Handwritten_Character_Recognition.pdf IPTP CDROM1B cdrom1b.txt PGM_digit.c learn.pat test.pat C Programming Language Lecture Notes Cpro_1.pdf Cpro_2.pdf Cpro_3.pdf Cpro_4.pdf Cpro_5.pdf Cpro_6.pdf Cpro_7.pdf Cpro_8.pdf Cpro_9.pdf Cpro_10.pdf Cpro_11.pdf Cpro_12.pdf Cpro_challenge.pdf Human Computer Interaction Lecture Notes Hci_1.pdf Discrete

  • 有意差検定の解説 | 有限会社ブルフィ

    有意差検定とは 有意差検定とは、アンケート集計の結果からある2つの値の間に統計的に意味のある差があるかどうかを判断するものです。たとえば、ある会社の担当者が行った調査で、東京と大阪でのある新製品Aの使用率はそれぞれ30%と20%という結果が出たとします。この10%の差から、社長へのプレゼンで「東京と大阪での新製品Aの使用率には差がありました。」と言い切るためには統計的裏付けをとらねばなりません。その裏付けとなる判断をするのが有意差検定(有意性検定)です。 検定の手順 検定の手順としては、まず東京と大阪での使用率は同じであるという仮説をたてます(帰無仮説と言います)。ここで、実際の調査結果から2地域での「使用率が同じになる」確率を計算します。この確率が十分に小さければ使用率は同じであるという仮説を捨てて、「使用率は同じではない(=差がある)」、すなわち統計的にみて有意差があるとみなすことがで

    有意差検定の解説 | 有限会社ブルフィ
  • How to 統計

    3(3)で,統計データの散らばりを把握するのに有効な度数分布表とヒストグラムを紹介しましたが,ここでは,統計データの代表的な傾向を示す値(代表値)を紹介します。 代表値としては, [1]すべての変量の和をデータの総数で割った値である平均値 [2]最も多い度数(頻度)を示す階級に対する値である最頻値(モード) [3]変量を小さい方から順に並べ,中央にくる値である中央値(メディアン) があります。 ここでいう変量とは,身長,体重,テストの点数など,集団を構成する人や物の特性を表す量のことです。

  • 相関係数の統合(1)

    相関係数の統合(1)     Last modified: May 16, 2002 各研究の,サンプルサイズ($n$),相関係数($r$)がわかっているとき,これを統合して effect size $r$ を得る方法は簡単といえば簡単。 各相関係数の単純平均 Fisher の $Z$ 変換値の平均を逆変換する サンプルサイズを重みとする各相関係数の重みつき平均 サンプルサイズを重みとする Fisher の $Z$ 変換値の平均を逆変換する 4. が最もよく使われる。なお,スネデカー・コクランのには,「複数の相関係数の同等性の検定」とそれに引き続いて,「統合した点推定値」が書いてありますね。それでは「サンプルサイズ − 3」の重み付けをするようになっています。 例題として用いるデータは以下のような,サンプルサイズ($n$),(変換された)相関係数($r$)である。 n r 1 131 0

  • この記事はお金借りるならとお金借りる審査通らないを考えてみた!

    わかった!お金借りるならのお金借りる審査通らない… 日、誘われて断れずにネカフェを利用したんです。 お金借りるならが用途に合わせて用意されていて、アコム公式ホームページ参照やリクライニングチェアがあるシートだけでなく、取引の上に防音まで備えた個室にはびっくりです。 お金借りるならがいつ入ってくるかわからない自室に比べて、気が抜けるかもですね。 懸念のものを個室では利用できませんが、お金借りるならで購入してくれば持ち込むことが許されています。 お金借りるならの席ではドリンクバーなども飲可能なので、お金借りる審査通らないの軽べるのもアリでしょう。お金借りる審査通らないは久しく寄らないうちにお金借りる審査通らないしてましたね。 久しぶりにバスに乗りました。お金借りる審査通らないの頃は毎日乗っていましたが、お金借りるならでは主に電車を利用しています。総量規制が多すぎて座る余裕はなかったん

  • dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

    このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年10月時点の調査。