タグ

統計に関するmoa108のブックマーク (19)

  • 統計・R・Stan関連の本、用途別のオススメ10冊 - StatModeling Memorandum

    2016 - 12 - 24 統計・R・Stan関連の、用途別のオススメ10冊 書評 R Stan 年末年始向けに、比較的読みやすいを中心にオススメします。 統計学 入門 色々読んでみましたが、現在決定版と言えるものは存在しないように思えました。個人的には、シグマと 積分 の復習、場合の数・数え上げの方法、確率、確率変数、確率密度、度数分布と ヒストグラム 、代表値・平均・分散、確率分布、同時分布、周辺分布、確率変数の変数変換、検定、散布図と箱ひげ図、回帰、相関あたりをRなどを使いながらシンプルに説明していくがあるといいと思うのですが、なかなかバランスのとれたいいがありません。初歩の初歩しか説明してない、グラフが少ない、検定にページを割きすぎ、分厚い、ちょっと難しいなどの不満点があります。立ち読みして自分にあったを選ぶのがいいと思います。ネットで検索して調べるのでもいいと思います

    統計・R・Stan関連の本、用途別のオススメ10冊 - StatModeling Memorandum
  • ハイブリッド型樹木法

    8. モデルに基づく再帰分割 8 一般の決定木の分割基準 Information Gain C4.5 Gini係数 CART 検定統計量 CHAID 他の分割基準を採用することもできる  下位モデルとして回帰式を採用  分割した時に2つの回帰式の残差平方和が最小になるように分割  適切な複数の回帰式になるようにデータを分割する 13. テストデータ・・・Boston 13 crim zn indus chas nox rm age dis rad tax ptratio black lstat medv 1 0.00632 18 2.31 0 0.538 6.575 65.2 4.0900 1 296 15.3 396.90 4.98 24.0 2 0.02731 0 7.07 0 0.469 6.421 78.9 4.9671 2 242 17.8 396.90 9.14 21.6

    ハイブリッド型樹木法
  • https://web.stanford.edu/~hastie/ElemStatLearn//download.html

  • 統計的学習の基礎 - 共立出版

    機械学習とは、コンピュータに学習能力を持たせるための方法論を研究する学問の名称であり、もともとは人工知能分野の一部として研究されていた。その後、機械学習は統計学と密接な関わりを持つようになり、「統計的学習」として独自の発展の道を歩み始めた。そして、1990年代から現在に至るまでの計算機やインターネットの爆発的な普及と相まって統計的学習の技術は目覚ましい発展を遂げ、いまや情報検索、オンラインショッピングなど、われわれの日常生活とは切り離すことのできない情報通信技術の根幹を支える重要な要素技術の一つとなった。 書は、このような発展著しい統計的学習分野の世界的に著名な教科書である“The Elements of Statistical Learning” の全訳である。回帰や分類などの教師あり学習の入門的な話題から、ニューラルネットワーク、サポートベクトルマシンなどのより洗練された学習器、ブー

    統計的学習の基礎 - 共立出版
  • 企画書や提案書にあと一押し!説得力が増す統計・市場調査レポート17選 | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

    こんにちは。ディレクターのエリカです。 企画書に一番必要なのは説得力ですが、自分が肌身を持って感じていることを文章で説明するのはとても難しいものです。そんなときに役立つのは、各種機関の調査レポート。企画書に「○○○統計調査レポート」なんて書かれたグラフが入っていたら、すごく説得力が増す気がしませんか? 調査レポートを公開している各種機関のリンクをまとめましたので、企画書にあと一押し欲しい!とお悩みの方はぜひ役立ててください。 ※注意事項 基的には無料で読めるものを集めましたが、詳細は有料の場合もあります。 また、引用についてのルールは各レポートの利用規約に準じてください! 【こちらもおすすめ】 説得力が増す統計調査レポート17選 調査機関のレポート まずは、専門の調査機関のレポートです。 WEBマーケティング研究会 http://www.webdbm.jp ウェブ関係のレポートを公開して

    企画書や提案書にあと一押し!説得力が増す統計・市場調査レポート17選 | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
  • 放送大学 - REDIRECT

    当サイトは移転しました。10秒後に以下のURLにリダイレクトします。 自動でリダイレクトされない場合、以下のリンクから移動してください。 https://info.ouj.ac.jp/~suuri/_webTohkei/ キャンパスネットワークホームページは教務情報システム(システムWAKABA)に統合されました。 上記に伴い「www.campus.ouj.ac.jp」ドメイン上の各サイトは「info.ouj.ac.jp」に移行されました。 2019 The Open University of Japan

  • 動的計画法が苦手な人が、動的計画法が超苦手な人へアドバイスしてみる - じじいのプログラミング

    この記事は、Competitive Programming Advent Calendar Div2013(http://partake.in/events/3a3bb090-1390-4b2a-b38b-4273bea4cc83)の8日目の記事です。 動的計画法(Dynamic Programming, DP)についての記事です。 12/9 前編にサンプルプログラム(http://ideone.com/2B7f4v)を追加しました 12/11 前編の図2つを差し替えました。 はじめに まずは、やネットの資料で、動的計画法についてのすばらしい解説はいろいろありますので、まずはそれらを参考に。 プログラミングコンテストでの動的計画法 http://www.slideshare.net/iwiwi/ss-3578511 最強最速アルゴリズマー養成講座:アルゴリズマーの登竜門、「動的計画法・メ

    動的計画法が苦手な人が、動的計画法が超苦手な人へアドバイスしてみる - じじいのプログラミング
  • 分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一

    ーーーーーーーーーーーーーーーーーーーーーーー schoo WEB-campusは「WEBに誕生した、学校の新しいカタチ」。 WEB生放送の授業を無料で配信しています。 ▼こちらから授業に参加すると、先生への質問や、ユーザーとのチャット、資料の拡大表示等が可能です。 https://schoo.jp/class/221/room ーーーーーーーーーーーーーーーーーーーーーーーRead less

    分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
  • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

    今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

    統計的消去で擬似相関を見抜こう! - ほくそ笑む
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 統計の基本事項

    トップページ→研究分野と周辺→システムの評価→ 基統計量 平均(算術平均)値は、(データ値の総和)÷(データ数)となる。(或るデータの値)-(平均値)を、そのデータの偏差という。偏差の絶対値の大きいデータが多ければ、そのデータ群はばらつきが大きい。データ群のばらつきの大きさを単純に偏差の総和とすると、偏差には正負があるので相殺されてしまう。 そこで、各データの偏差を二乗する(こうすれば必ず正の値になる)。(各データの偏差の二乗の総和)÷(データ数)をそのデータ群の分散と呼び、ばらつきの大きさを表す。また、分散の平方根を標準偏差という。英語では偏差はDeviation、分散はVariance、標準偏差はStandard Deviationとなるので、標準偏差はS.D.と略記される事も多い。 統計の最も基的な量である基統計量としては、他に最大値、最小値、範囲(最大値-最小値)、中央値(デ

  • 海と魚と統計解析

    海と魚の世界にようこそ ★新サイト完成しました! 3秒後に自動的に移動します 変わらない方は こちらからどうぞ http://logics-of-blue.com/ 管理人の馬場真哉(北大院水)です。 当サイトは、海や魚に関する学問「水産学」や蓄積されたデータを有効活用するための「統計学・データマイニング」に関する話題を主として、それらにまつ わる色々な話を思いつくままに書き連ねたウェブサイトです。 また、フリーのデータ解析環境「R」のプログラムも展示しています。

  • 統計分析をフル活用し、年間数千万以上の広告宣伝費削減に成功─ リクルート式ビッグデータのビジネス活用最前線

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    統計分析をフル活用し、年間数千万以上の広告宣伝費削減に成功─ リクルート式ビッグデータのビジネス活用最前線
  • 確率過程ゼミ2013

    発表 #0 はじめに 確率過程では何を捉えるか.例えば,交通現象における「差異」と「変化」の関係を考える.「差異」は個体間の違い.「変化」は同一個体が方向性を持って変わること.変動を捉えるとき,従来では,観測において長時間の安定状態を調査してきた.しかし,社会における不確実性が増加してきたことなど,これを捉えることは必要であるが難しくなってきている.1断面だけでなく,繰り返しデータの集計を用いる.このときに確率論が必要になる.一義的には定義できない予測困難な現象を把握するときに,確率過程の理解が不可欠だと考えられる. 発表資料(pdf)  議事録 #1 確率論の基礎 ゼミのはじめに,確率過程の基礎を1)事象と確率,2)確率分布関数と確率密度関数,3)平均として復習した.1)では確率の考え方にはじまって条件付き確率、ベイズの定理を紹介し,2)では確率変数という概念を導入し,関数としての確率の

  • ニューヨーク市に学ぶ大規模データ活用の真髄

    ブルームバーグ市長が推進するニューヨーク市政府の大規模データ活用に携わっていた筆者が、さまざまな実例を基に、企業が今後いっそう注力すべきデータ解析のキーポイントをお伝えする。 近年、ブログやSNSを活用したユーザー主体の情報交換が盛んである。「YouTube」をはじめとする動画投稿サイトでやり取りされる情報は、さらにほかのユーザーからのフィードバックを受け、巨大な集合知を形成している。また、これまで活用することがなかった非構造化データや、自由度の高い準構造化データへの期待も高まっている。センサーデータ、空間情報やバイナリ情報、音声、画像、動画情報など、これまでの常識的な解析対象の蓄積型構造化データの枠組みを越え、多様化するデータ(調査会社IDCのレポートによると、2020年に世界で作成されるデータ量は、35.2ゼタバイトに達すると予測されている)は、総量で2020年までにおよそ現在の44倍

    ニューヨーク市に学ぶ大規模データ活用の真髄
  • 統計的因果推論(傾向スコア)の勉強会資料をアプしてみた - Take a Risk:林岳彦の研究メモ

    みなさまお久しぶりです。私はけっきょくminor revisionに三ヶ月もかかってしまい他の仕事にしわ寄せキまくってます。 今回は某勉強会で傾向スコアを扱ったのでその勉強会資料をアップしてみます(環境によってはサムネ画像がでないかも)。 傾向スコア:その概念とRによる実装 View more presentations from takehikoihayashi *上のファイルはプレゼン用(差分)なので印刷用PDF資料としてはこちらのファイル( PSAseminar_file20120426.pdf )をどうぞ。 *追記:上記のプレゼン内で使っているRのscriptのfileもどうぞ( PropScore_Rscript.R ) 傾向スコアってなにそれおいしいの? 傾向スコアとは何かというと、実験ができない場合(調査観察データなど)における交絡の調整方法です。(一応言っておきますが交絡を

  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • 発表資料アプ:「比例ハザードモデルはとってもtricky!」 - Take a Risk:林岳彦の研究メモ

    どもです。林岳彦です。ももカッパよりもアゲルちゃんのほうがいいと思います。 さて。 最近、某カジュアル系勉強会で、疫学研究などで頻繁に用いられる「比例ハザードモデル」をテーマに発表をしたのでその資料を晒してみます(資料内で用いているRスクリプト→ CoxPH.R ) 比例ハザードモデルはとってもtricky! from takehikoihayashi 何卒よろしくです! #次回は統計的因果推論ネタで、「因果関係がないのに相関関係があらわれるケース」についてまとめる予定です(現在執筆中) (今回の発表で参考にさせていただいた比例ハザードモデルに関する資料のリスト) 【書籍】 生存時間解析―SASによる生物統計 作者: 大橋靖雄,浜田知久馬出版社/メーカー: 東京大学出版会発売日: 1995/04メディア: 単行購入: 2人 クリック: 65回この商品を含むブログ (2件) を見るwhat

  • 階層ベイズによるワンToワンマーケティング入門

    [読会]Causal transfer random forest combining logged data and randomized expe...shima o

    階層ベイズによるワンToワンマーケティング入門
  • 1