タグ

統計に関するpapiroのブックマーク (9)

  • 【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート

    主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

    【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート
    papiro
    papiro 2017/01/22
    簡単そうで簡単では無い
  • さまざまな確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】

     さまざまな確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】 ■ さまざまな確率分布 (probability distributions) 観測される現象は,確率的に変動するものが多いと考えられます.その観測されたデータを説明する統計モデルに,どの確率分布を使えばうまく説明できるでしょうか. 正規分布や二項分布など,確率分布の種類は数多く,いろいろなカタチ(分布形)があります.確率分布の当てはめを考えるには,そのカタチ(分布形)を知ることが重要です.各確率分布の母数(パラメータ)によってそのカタチ(分布形)が決まります.確率変数には離散型と連続型があり,その範囲もさまざまです. このページは,代表的な確率分布について,それらを比較・検討しやすいように母数(パラメータ)やグラフ等を一覧表にまとめたものです. 1. 離散型確率分

    papiro
    papiro 2015/12/29
    計測データをどのモデルに当てはめるか?
  • 実務で使う統計手法は、5つ。すごい、そんなシンプル?

    このセミナー、冒頭の渋谷 直正さん(日航空 旅客販売統括部Web販売部 1to1マーケティンググループ アシスタントマネジャー)のお話がとても参考になりました。 まず、渋谷さんはご存知のように、2014年に「データサイエンティスト・オブ・ザ・イヤー」を受賞され、ビジネス・サイドにおける、データサイエンスのリーダー的存在です。 その渋谷さんの「実務で使う分析手法は5つで十分、マーケターこそデータサイエンティスト候補」という講演は、多くの示唆に富んだものでした。 まず、みなさんが気にしている5つの手法とは、 クロス集計 ロジスティック回帰 決定木 アソシエーション分析 非階層的クラスター分析(k-meansなど) の5つです。統計の教科書にはさまざまな手法が出てきますが、マーケターが実務で使うのはこの5つ程度だと説明されるのです。でも、この説明には、私も思い当たる部分があります。東大数学

    実務で使う統計手法は、5つ。すごい、そんなシンプル?
  • 【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita

    統計をこれから学ぼうという方にとって、非常に重要な概念ですが理解が難しいものに「標準偏差」があると思います。「平均」くらいまでは馴染みもあるし、「わかるわかるー」という感じと思いますが、突如現れる「標準偏差」 の壁。結構、この辺りで、「数学無理だー」って打ちのめされた方もいるのではないでしょうか。 先にグラフのイメージを掲載すると、下記の赤い線の長さが「標準偏差」です。なぜこの長さが標準偏差なのか、ということも解き明かしていきます。 (code is here) 記事では数学が得意でない方にもわかるように1から標準偏差とはなにか、を説明してみようという記事です。 数式はわかるけど、イマイチ「標準偏差」の意味わからんという方にも直感的な理解がしてもらえるような説明もしていきますので、ぜひご覧ください。 (※ この記事では標準偏差の分母に $n$を使用しています。$n-1$を使用するケースも

    【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita
  • グラフでウソをつく方法――統計リテラシーのための基礎文献(松谷創一郎) - エキスパート - Yahoo!ニュース

    ウソグラフの世界 ここ数年、統計学がブームとなっています。オープンデータやビッグデータなど、IT化の進展とともにそれまで以上にさまざまな数字が扱われるようになっています。 そんな統計において、欠かせないものがグラフです。数値を図形化して視覚的な理解をうながすグラフには、棒グラフ、折れ線グラフ、円グラフなどなど、さまざまな種類があります。 ただ、意図的かどうかはさておき、作為が加えられたグラフを見かけることも珍しくありません。数値に手を加えることはもってのほかですが、それよりも目立つのは見せ方を工夫(作為)して実際の数値以上の効果や影響を錯覚させようとするものです。そうしたものは、「ウソグラフ」あるいは「クソグラフ」などと呼ばれたりします。 それでは、こうしたウソグラフにはどういうものがあるのでしょうか? 電子コミック市場は急成長? 先日『News Picks』という新興のネットメディアに、

    グラフでウソをつく方法――統計リテラシーのための基礎文献(松谷創一郎) - エキスパート - Yahoo!ニュース
  • 統計解析 & R言語超初心者入門資料まとめ

    興味を持ち続けていた統計解析や、R言語の勉強をはじめました! まだまだ初歩の初歩ですが、この記事がいつか偉大な一歩になれるように頑張っていく所存ですw まずは、R言語や統計解析に関する入門記事や、モチベーションがアップしそうな記事をまとめていきます! (02/23 11:00) 初学者の人にお勧めな資料にフォーカスしてまとめ直し 🍮 [スライド] 統計学入門 統計学の全体像をつかむのに最適なスライドです。初歩…とはちょっと呼べないくらい内容が深いです! 🏈 [スライド] 初めての「R」 統計解析を始めるときにWindowsな方も、Macな方もとっつきやすのが『R』です。このRを完全初心者をターゲットに説明をしていただけている資料です。超わかりやすいです! 🍄 [デスクトップアプリケーション] R用のIDE: RStudioRStudio RStudioはR言語用のIDEです。Wind

    統計解析 & R言語超初心者入門資料まとめ
  • 統計屋のためのAWK入門 - あんちべ!

    はじめに 稿はAWKという言語を用いて、 ごく簡単にデータ分析用の前処理*1をするための解説記事です。 AWKは短いコマンドを記述するだけで多様なデータ処理を可能にします。 特にデータの抽出に関して恐るべき簡易さを提供します。 具体的には、input.txtというファイルの中から "fail"という文字列を含む行を抽出したければ次のように書くだけです。 awk /fail/ input.txt つまり、スラッシュ記号で文字列を指定するだけで その文字列を含む行を抽出できるのです。 大変簡単ですね! また、awkはLinuxMacには標準で入っており、 Windowsでもawk.exeを一つ用意するだけなので、 面倒なインストール作業や環境構築は不要で誰でも即座に使えるため、 自分で書いた処理を他人に渡したり*2各サーバに仕込むなども簡単に出来ます。 複雑な処理をする場合はPython

    統計屋のためのAWK入門 - あんちべ!
    papiro
    papiro 2014/09/16
    データ処理にawk再入門
  • 404 Blog Not Found: R - 汎用言語としても素敵なんでR

    2007年02月23日18:00 カテゴリLightweight LanguagesMath R - 汎用言語としても素敵なんでR ちょっとある事情で使い始めたのだけど、惚れてしまった。 「単なる」統計言語にしておくにはもったいない。 Perl, Python, Ruby, JavaScriptといったLightweight Languageを日常使っている人なら、それこそガンダムにはじめて乗ったアムロのごとく使えるのではないか。 はじめてのS‐PLUS/R言語プログラミング 竹内俊彦 ほんと、さわり程度であれば、「R言語 - Wikipedia」を見ただけでもつかめるし、左の「はじめてのS‐PLUS/R言語プログラミング」を読めば、ジャブローまで生き残れるぐらい使えるように使えてもおかしくないのでR。ちなみにWikipedia語版のR言語の説明は、珍しく英語版(R (programm

    404 Blog Not Found: R - 汎用言語としても素敵なんでR
  • Different strokes for different folks.:苦手分野 - livedoor Blog(ブログ)

    papiro
    papiro 2009/12/07
    統計学!FASとPPS
  • 1