タグ

統計に関するSuiJackDoのブックマーク (9)

  • 統計学の講義資料(2022年度) | Logics of Blue

    帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 目次 資料について 統計学の講義資料 1.資料について 帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 もとの講義資料とは異なる点もあるのでご注意ください。 万が一何か問題があれば、当ブログにコメントをいただけますと幸いです。 スライドにも記載の通り、以下の利用を想定しています。 想定①:講義の受講者が復習に利用する 想定②:未受講者が統計学入門資料として利用する 基的には想定①ですが、文系の学生をメインターゲットとした統計学の格的入門資料は少ない印象です。 未受講者の方にも役に立つかもしれないと思いWeb上で公開することにしました。 資料は1年間にわたる講義資料となっています。数回

  • データ分析のための統計学入門.pdf

  • Rのパッケージを紹介するコミュニティ·crantastic! MOONGIFT

    crantastic!はRuby on Railsで開発されたオープンソース・ソフトウェア。Rというのは有名な統計解析ソフトウェアだ。オープンソース・ソフトウェアとして公開されており、多数の学生および研究者によって使われている。世界中の方々が使っているとあって、Rを拡張するパッケージも無数に存在する。 パッケージ更新情報 そんなRのパッケージアップデータ情報や、レビュー、紹介を通じてコミュニティを構築するのがcrantastic!というWebサイトであり、そのコード自体がオープンソースとして公開されている。このシステムはRに限らず利用ができるのではないかと思わされる仕組みだ。 主な機能は新着情報、各パッケージの情報(紹介、メンテナー、ライセンス、依存パッケージ、変更履歴)、レビュー、レーティングとなっている。既に登録数が2000を越えており、数多くのパッケージがあることが分かる。これだけの

    Rのパッケージを紹介するコミュニティ·crantastic! MOONGIFT
    SuiJackDo
    SuiJackDo 2009/09/14
    「Rのパッケージアップデータ情報や、レビュー、紹介を通じてコミュニティを構築」
  • 適切なクラスタ数を推定するX-means法 - kaisehのブログ

    K-means法によるクラスタリングでは、あらかじめクラスタ数Kを固定する必要があります。HatenarMapsでもK-means法を使っているのですが、クラスタ数は(特に根拠もなく)200個に決め打ちになっていました。 これに対して、X-means法というK-means法の拡張が提案されていることを知りました。X-means法を使うと、データに応じて最適なクラスタ数を推定できます。 K-means and X-means implementations http://www-2.cs.cmu.edu/~dpelleg/download/xmeans.pdf X-means法の考え方は、K=2で再帰的にK-means法を実行していくというもので、クラスタの分割前と分割後でBIC(ベイズ情報量規準)を比較し、値が改善しなくなるまで分割を続けます。 調べたところ、Javaのデータマイニングツー

    適切なクラスタ数を推定するX-means法 - kaisehのブログ
  • 犯罪の九割は失業率で説明がつく

    松尾匡のページ  08年1月14日 犯罪の九割は失業率で説明がつく (追記:1月16日, 再追記:1月17日) 続報あり。以下の分析結果には「誤差の系列相関」という問題がありました。続報ではその解決に取り組んでいます。 再追記:08年1月17日  下の方の昨日書いた追記で、管賀江留郎さんからいただいた批判のエントリーの中で言われていた、「警察がデータを操作したため相関する」という「説」について、管賀さんご自身の説であるように表現した一文がありました。私自身、気で言われていることかどうかは疑わしいと思っていましたが、ネタと断定することもできず、ああいう表現になりました。  このたび管賀さんとのやりとりの中で、これが管賀さんご自身信じておられない、いわゆる「釣り」のネタであることが明らかになりましたので、当該の表現を削除して訂正します。管賀さんはこれがひとつの積極的主張として一人歩

    SuiJackDo
    SuiJackDo 2008/01/15
    すごい。これ、先行する研究は他にないのだろうか……。
  • R を使って実際に統計解析をする AtoZ

    R を使って実際に統計解析をする AtoZ     Last modified: Mar 28, 2006 1. データファイルの準備をする R で処理するデータは,データフレームとして読み込まれる。データは,変数名,その変数の取る値,欠損値などさまざまな情報を持っている。これらの情報を全て定義しなくてもデータの分析を行うことはできるが,適切に定義しておくと,R での解析結果をそのまま報告書に含めることもできる。 たとえば,10人について,性別と血液型のデータがあるとしよう。 データフレーム(df) は, df <- data.frame(sex = c(1,2,1,1,1,2,2,1,2,2), blood.type=c(1,2,3,4,1,2,3,3,2,1)) のようにもできる。 > df sex blood.type 1 1 1 2 2 2 3 1 3 4 1 4 5 1 1 6

    SuiJackDo
    SuiJackDo 2007/12/27
    Rのわかりやすい使用例。
  • R 入門

    Rとは? R は統計計算とグラフィックスのためのフリーソフト(GNU-style copyleft)である。 Rは商用ソフトのS(AT&T ベル研究所のRichard A. Becker, John M. Chambers, and Allan R. Wilks により作られた統計解析やグラフィックスのための言語であり、製品としては S version 4 や S-Plusがある)に操作環境などが良く似ており、Sを使っている場合には関数の利用法がほぼ同じことから取っつきやすく、Sで定義した関数などはRでもほとんど変更なしに動作する。 Sの現在のバージョンほどは新たな手法やグラフ表示法は取り入れられていないが、通常の解析ならば不都合は感じないだろう。 CRAN(The Comprehensive R Archive Network)にはRに対する追加パッケージも沢山あり、新たな手法は、これら

    SuiJackDo
    SuiJackDo 2007/12/27
    R は統計計算とグラフィックスのためのフリーソフト(GNU-style copyleft)である。
  • 社会実情データ図録 Honkawa Data Tribune

    最も高く、7割近くが病院で亡くなる日韓国。一方、オランダやノルウェーでは病院死は3割以下。新型コロナの影響だけでなく、日を含む多くの国で病院死は低下傾向。

  • 木走日記 - 倫理綱領実践規程に違反しているマスメディアの世論調査報道〜「朝日RDD」方式って何なんだよ?

    ●なんともバラバラの結果でどれが当なのかわからない大新聞の全国緊急世論調査(電話)〜安倍ちゃん好き嫌い度がそのまま公正なはずの「世論調査」の結果に反映しちゃっているわけですが(苦笑) さて27日夜から28日にかけて日の大新聞・通信社5社は一斉に全国緊急世論調査(電話)による改造内閣支持率調査を実施したのであります。 【朝日】 改造内閣支持33%、不支持なお53% 社世論調査 2007年08月28日22時48分 http://www.asahi.com/politics/update/0828/TKY200708280452.html 【読売】 改造内閣支持率44・2%、参院選後比12・5ポイント増 安倍改造内閣 (2007年8月28日21時27分 読売新聞) http://www.yomiuri.co.jp/politics/news/20070828i313.htm 【毎日】 毎日

    木走日記 - 倫理綱領実践規程に違反しているマスメディアの世論調査報道〜「朝日RDD」方式って何なんだよ?
    SuiJackDo
    SuiJackDo 2007/08/31
    まとめると、朝日新聞にとっては国民ないし有権者とは朝日新聞の購読者を指す。それが朝日RDDクオリティ。記事自体は統計調査の基本を押さえていて極めて良質。
  • 1