タグ

統計に関するbk2321866のブックマーク (14)

  • 重回帰分析の例題サンプルデータ10選 | XICA-Labs

    【分析の意図】 売上に影響する要因を分析することで、なるべく機会損失・廃棄ロスの少ない適切な販売体制を取れるようにしたい。 【目的変数】 アイスクリームの売上 【説明変数】 最高気温 通行人数 【分析の意図】 高田馬場駅の周辺の物件100件を調べ、様々な物件の条件(広さ、駅からの遠さ、階数など)がどれくらい家賃に影響するのかを調べたい。 【目的変数】 物件の家賃 【説明変数】 様々な物件の情報(広さ、駅からの徒歩時間、築年数、階数、様々な設備の有無、etc…)

    重回帰分析の例題サンプルデータ10選 | XICA-Labs
  • 相関係数の大小は相関の有無とは全く関係ない件について。

    話題になった日経のトンデモグラフに対する突っ込みで、相関係数には言及してもp値、有意水準についての言及は少なく、勘違いしている人が多いのではないか?と感じたのでブラッシュアップも兼ねてまとめました。

    相関係数の大小は相関の有無とは全く関係ない件について。
  • 統計学・データサイエンスの勉強法

    ここ数年、私はデータサイエンスについて学んでいます。おすすめの学習資料を紹介したいと思います。 教師用の教科書と初心者用の教科書 私自身、データサイエンスを学ぼうとして色々なソースを試してみました。残念なことに、日語の良い学習資料は見つけられませんでした。どこかのブログで読んだことがありますが、教科書は教師用と学生用の二週類があるそうです。一つめは内容が既に分かっている教師の為の教科書で、日はこのタイプです。もう一つのタイプの教科書は自学自習を目的に作られているので、教師なしで学ぶできる教科書になっているということで、アメリカはこのタイプの教科書が多いです。私自身、他の文系・理系の教科書を探した時もアメリカの教科書の方が分かりやすく、そのだけを読めば分かるようになっていると同じ印象を持ちました。 オンライン教育(MOOC) アメリカは科学教育に熱心であり、最近はやりのMOOCでも豊富

    統計学・データサイエンスの勉強法
  • 統計科学・機械学習の講義

    統計科学や機械学習、および関連する諸分野の講義・講演のアーカイブです。講師名の敬称は略させて頂いています。★の数は専門性・予備知識の量を示します。★1つは一般の方でも楽しめる部分のある講演(レベルが低いという意味ではありません)、★2つは大学院生向きとして標準程度、★3つはより専門的な講演、をそれぞれ示します。

    統計科学・機械学習の講義
  • データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは

    知人に、確率・統計を勉強するにはどんなん読んだら良いんかね?と聞かれたので、まとめる。 線形代数 統計を勉強しようと思ったら、先ず、線形代数を勉強するのが良いと思う。回帰分析とか主成分分析とか多次元尺度構成法とか、こういう有名ドコロが一発で分かる。線形代数を知らずに統計ので「コレコレの計算で出てきた値が第一主成分だよ」みたいな説明を何回くり返し読んでも、多分、一生理解出来無いと思う。対称行列は直交行列で対角化出来るよね、とか、これは射影行列の形だね、とかが自然に分かるようになってから、統計のを読むとよく理解出来る。 で、線形代数のお奨めはこれ。 プログラミングのための線形代数 作者: 平岡和幸,堀玄出版社/メーカー: オーム社発売日: 2004/10/01メディア: 単行購入: 27人 クリック: 278回この商品を含むブログ (90件) を見るプログラミングのための…とあるんだけど

    データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは
  • 数字で見る日本仏教 | 日日是好日 | 彼岸寺

    皆さんおはようございます。松島靖朗です。 IT技術が生活の隅々まで浸透し、消費行動を中心に人が動くところ、大量のデータが生み出される時代となりました。いま話題のビックデータ時代の到来です。なんでもビックデータを活用すると、今まで見えなかったものが見えてくる。それをもとに将来予測が出来るようになるといわれています。にわかに関連市場も賑わいはじめています。 僕が気になっているのは、大量のデータの中から見出される事象間の相関関係が、因果関係よりも重要になってくるという視点です。 仮に、膨大な電子カルテのデータから「オレンジジュースとアスピリンの組み合わせで癌が治る」ことが言えるならば、正確な理由はどうであれ、この組み合わせが癌に効く、という事実の方がはるかに重要となる。というようなお話。 我々はなにか起こると原因を求めますが、原因がわからないことも多いです。データを分析利用することで、なんらかの

  • データサイエンティストを目指すに当たって、ぜひ揃えておきたいテキストたちを挙げてみる - 渋谷駅前で働くデータサイエンティストのブログ

    追記2 2015年末の時点での最新リストはこちらです。 追記 この記事の5カ月後にもう少し更新した内容の「お薦めリスト」記事を2つupしてますのでそちらもお読みください。 2013年秋版:データサイエンティストを目指すなら揃えておくべき10冊 - 六木で働くデータサイエンティストのブログ 2013年秋版:データ分析初心者にお薦めする「基礎を当にゼロから学ぶ」ためのテキスト5冊 - 六木で働くデータサイエンティストのブログ 今回は、僕が実際に自然科学の研究者からデータサイエンティストへと転身するに当たって、いつも脇に置いていたテキストや同僚が参考にしていたテキストをまとめて紹介します。 ※以下僕も持っているものには「*」を打ってあります*1*2*3 統計学 統計学入門 (基礎統計学) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メ

    データサイエンティストを目指すに当たって、ぜひ揃えておきたいテキストたちを挙げてみる - 渋谷駅前で働くデータサイエンティストのブログ
  • R言語で統計解析入門: 目次1 テクニカルデータプレゼンテーション  梶山 喜一郎

    Technical Data presentation in R コピペで学ぶ Rでテクニカルデータプレゼンテーション 1.基礎統計解析編 グラフィックス・リテラシ-教育: 「図学 I ・図形情報 I ・統計学」科目 修了後のコースウェア 福岡大学工学部図学教室   梶山 喜一郎 ・つまみいで,学習しないように願います. ・データの可視化を体系・系統だったスキルにするために順を追って学習する. ・統計ブームに乗っている学習者も先人に感謝の気持ちを.さらに, ・確かなスキルにするために,教科書・解説書を理解し,Rスクリプトで確認. A. はじめに--ここは統計・解析の必要を味わった後で読めばよい まず,統計の手続きを実行する.慣れたら統計的に考えよう. 学校の統計学を復習--買った教科書とノートをまた読むだけ a. 測定と尺度 Measurement and scale b. 記述統計学の

  • 統計の教科書を公開 - 【小波の京女日記】(2013-03-12)

    _ 統計の教科書を公開 2013年度の学部の講義「統計学」で使用するための教科書を公開します. http://ruby.kyoto-wu.ac.jp/~konami/Text/ このテキストは,今年度まである出版社から出してもらっていたのですが,かなりの訂正と加筆を行い,元のからはかなり内容が離れてきてしまいました.また出版社も,売れ行きがぜんぜん悪いし,カリキュラムが変わって100人以上いた受講者が30人程度に激減して儲けのタネにならなくなり,書店から引き上げてしまったようです. そこで,思い切って改訂版はネットに公開して一般の人に自由に使ってもらい,学生が授業で使う分については,小部数印刷の業者に必要なぶんだけ印刷製してもらうことにしました.なんと2日で製までやってくれるということで,初回の授業で注文をとってから印刷すれば,次の講義では使えるわけです.便利な世の中です. どんな教

  • 若き経済学者のアメリカ

    もちろん僕はそういうアツさが決してキライではない。だから確かに一読の価値はある内容だとは思う。ただ、「これからの10年で最もセクシーな職業」というハル・ヴァリアンの有名な台詞に言及してはいるものの、書の中身からは統計学のセクシーさが最後まで伝わって来なかったのが、個人的にはとても残念でならない。 以下の3冊と比肩するくらいの、セクシーでワイルドでエキサイティングな統計学書が登場したかと思ったのだが、果たしてそれは期待し過ぎだっただろうか。

  • はてなブログ | 無料ブログを作成しよう

    我が家のダグウッド ダグウッドとはハナミズキのことである。昔、日からポトマックリバーの桜の苗木を送った返礼として、アメリカから送られて来たのが日での始まりで、アメリカ原産でアメリカヤマボウシともいうらしい。 最近では日でも、あちこちで、街路樹であったり、庭木であっ…

    はてなブログ | 無料ブログを作成しよう
  • 分散の定義が絶対値を使わず二乗を使う理由(?) - 結城浩のはてなブログ

    1. 確率変数Xの分散V(X)は、Xの期待値をE(X)とすると、V(X) = E( (X - E(X) )^2)で定義される。 2. 言い換えれば、分散とは「「期待値からのずれ」の二乗」の期待値である。 3. 分散は、確率変数の値がどれだけ期待値からずれるかを表すもの(として定義したい)。 4. 期待値からのずれは大きくずれる場合と小さくずれる場合の二つがある。 5. 二乗しておけばどっちに転んでも大丈夫。 6. でも、絶対値を取ることにしてもいいよね。 7. いいけど、絶対値とる計算よりも二乗するほうが計算便利だし。 …と、ここまではいいと思うんですが、以下のA,Bも二乗する定義を採用する理由になるでしょうか? A. 分散に対して、等式 V(X) = E(X^2) - (E(X))^2 が成り立つ。 《分散は、平方の期待値から期待値の平方を引いた値になる》 B. 確率変数Xが期待値からず

    分散の定義が絶対値を使わず二乗を使う理由(?) - 結城浩のはてなブログ
  • ミクの歌って覚える統計入門

    VOCALOID 初音ミクの歌のパワーで、統計の基礎を楽しく学んじゃおう。 もうつまらない教科書はいらない!

  • ロジスティック回帰

    目次 1)ロジスティック回帰分析概説 2)ロジスティック回帰分析はどんな時に使用するか 3)ロジスティックモデルとは 4)ロジスティック回帰分析で得られるのは 5)オッズ比とは 6)オッズ比の95%信頼限界とは 7)ダミー変数について 8)変数選択上の注意点 9)ロジスティック回帰分析が可能な統計ソフト 10)ロジスティック回帰分析に関する参考書 1)ロジスティック回帰分析概説 近年の外国の論文にロジスティック回帰分析が非常に増えており、これが理解できないと論文を読めないことが多い。このことは、単変量解析では十分な解析ができないことが多いことを示唆しており、今後日の論文でも、ロジスティック回帰分析が確実に増加していくものと思われる。しかし、ロジスティック回帰分析を理解しようと思っても、やさしい教科書は非常に少ない。ロジスティック回帰分析は、疫学調査などの大規模なスタディには必須で

  • 1