タグ

analysisに関するmzkIIIのブックマーク (8)

  • Welcome to a Little Book of R for Biomedical Statistics! — Biomedical Statistics 0.2 documentation

    Welcome to a Little Book of R for Biomedical Statistics!¶ By Avril Coghlan, Parasite Genomics Group, Wellcome Trust Sanger Institute, Cambridge, U.K. Email: alc@sanger.ac.uk This is a simple introduction to biomedical statistics using the R statistics software. There is a pdf version of this booklet available at https://media.readthedocs.org/pdf/a-little-book-of-r-for-biomedical-statistics/latest/

  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • はてなブログ | 無料ブログを作成しよう

    プロジェクトマネジメントで娘の夏休みの宿題炎上を防止しました 娘の夏休みの宿題プロジェクト炎上 8歳9歳の娘が朝から泣きわめいていたので、何ごとかと思い話を聞いてみました。泣きじゃくっていたので要領を得なかったのですが、まとめると以下みたいでした。 「宿題やったのに、ママがテレビを見せてくれない。自分は頑張った…

    はてなブログ | 無料ブログを作成しよう
  • 科学と報道の間で (ニュートリノの速度と光の速度) | 油断するなここは戦場だ

    新しい実験データについての新聞・テレビ報道が研究者の間の「雰囲気」を伝えていないというのは、たしかにあることなのだけど、今回ばかりは少し乖離が大きすぎるような気がするので、久しぶりに素粒子物理の話をブログに書こうと思います。 OPERA は CERN から打ち出したニュートリノビームを、730km離れたイタリアのグランサッソという地下実験施設でで受け止める実験です。CERN から出るビームはミューオンニュートリノですが、ニュートリノ振動があるので長距離を飛ぶ間にタウニュートリノに変化し、これが測定器にあたる時にタウレプトンが出ます。この実験はそのタウレプトンを測ろうとするものです。主要な測定器はエマルジョン(写真乾板)という名古屋大学が長く手がけてきた装置で、日の貢献が極めて大きいことでも知られています。 今回の発表はこのニュートリノ振動とは関係がなく、ニュートリノがグランサッソに到着す

    科学と報道の間で (ニュートリノの速度と光の速度) | 油断するなここは戦場だ
    mzkIII
    mzkIII 2011/09/25
    いずれにしても、疑問に感じるのはテレビ・新聞の報道姿勢です。
  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
  • 地震の発生確率について、文系らしく説明してみる

    元総務大臣の竹中平蔵氏が、地震の発生確率についてラフに計算した数字をtwitterでつぶやいたので反響を呼んでいる。 この先一年、一ヶ月で考えれば確率は小さいと言いたかっただけなので、適当につぶやいたと思うのだが、『正しい確率計算』に関して錯綜した意見が飛び交っていたので、文系らしく説明してみる。 1. 周期性の有無で確率分布が変わる 地震の発生確率の予測は、まず確率分布を仮定し、過去の発生間隔をあてはめることになる。 ここで周期性が無い場合は指数分布を、周期性が有る場合は対数分布やワイブル分布、BPT分布をあてはめる事になる。 分布が変わると、大きく確率は変化する。特に指数分布と、その他の分布では何倍もの差になるので、どちらを採用するかで世界が変わる。 2. 確率分布はBPT 東海地震の発生確率の予測には、Brownian Passage Timeと呼ばれる確率分布が予測に使われている。

    地震の発生確率について、文系らしく説明してみる
    mzkIII
    mzkIII 2011/05/13
    こちらも.
  • 地震の発生確率について - LibrePDMの日記

    竹中平蔵さんのtweetが大分叩かれているようです。 http://togetter.com/li/133823 この87%という確率はBPT分布に従って算出されています。*1 http://www.asahi.com/national/update/0507/TKY201105060460.html によると、直近の東海地震は1854年の安政東海地震で、さらに周期は100-150年と考えられているとのことです。 つまり、下記の図(正確ではありません。ラフなものです)の、 (青色部分の面積)÷((青色部分の面積)+(黄色部分の面積))が 0.87 であるということです。 このように、一様な分布ではないため、たとえば直近の1年間に東海地震が起きる確率は、(87% ÷ 30) よりも大きいものになります。 逆に、今から29年後から30年後までの1年間に東海地震が起きる確率は、(87% ÷ 30

    地震の発生確率について - LibrePDMの日記
    mzkIII
    mzkIII 2011/05/13
    コメント欄が面白い.プレートに関するデータから計算するのではないんだ.知らなかった.
  • 1