タグ

統計に関するhagurin_Lv1のブックマーク (9)

  • 野良ビッグデータへのお誘い

    2. ⾃⼰紹介 •  名前: takano •  Twitter: @mtknnktm •  仕事: Web系企業のデータ関連あれこれ •  興味: 計算社会科学・複雑系科学 •  もろもろ – Publications: https://sites.google.com/site/mtkn35699/ – Slide: http://www.slideshare.net/MasanoriTakano1 – Blog: http://mtkn.hatenablog.com/ 2 3. •  ふと回帰分析したくなった時 •  ふとMCMCしたくなった時 •  ふと前処理したくなった時 •  ふと機械学習したくなった時 •  ふと集計したくなった時 •  ふと社会科学したくなった時 でも iris はもう飽きた → そんなときのために、 誰でも使えるデータをご紹介 3 5. おもしろいと思った

    野良ビッグデータへのお誘い
    hagurin_Lv1
    hagurin_Lv1 2017/01/22
    ちょうおもしろい
  • 平均値 vs 中央値

    作者のページ ときどき所得などのデータを平均値(算術平均)のみで示している記事があります。しかし極端な外れ値があったり、著しく非対称だったりするデータは中央値で扱わないと実態がよく分からなくなってしまう場合があります。「平均所得600万円!」に騙されないように「平均値」と「中央値」の違いを実感しましょう。 追記1:以下の分布はLog-normalを仮定しているため必ず 中央値<平均値 です。そうじゃない分布も当然存在します。 追記2:このページの趣旨は「平均値だけ見ても実態がよく分からんこともあるので元の分布や他の統計量も気にしようね」ってことなので一々「最頻値も見なきゃ駄目だ」とかメールしてこなくていいです。 使い方:スライダをグリグリ動かして、それぞれの代表値を持つ分布の例を見てみよう。

  • 【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート

    主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

    【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート
  • 「ヤフコメ」と「はてブコメント」の違い。テキストマイニングより見えてきたもの - プリキュアの数字ブログ

    プリキュアにあんまり関係ない記事です。興味ない方はスルーして下さい。) 先日(4/13)、当ブログを紹介していただいた朝日新聞withnews様の記事が、(数時間ですが)ヤフーのトップに掲載されました。 娘がプリキュアに追いついた日… 父のブログに涙する人が続出 当たり前の日常の中にある愛情、著者に聞く (withnews) - Yahoo!ニュース さすがにヤフーのトップ、記事中に直接リンクが貼ってあったわけではありませんが、多大な反響があり、その1日だけで「イワオ~キン骨マンの超人強度」くらいにはPVを頂きました。 はてなブックマーク、ツイッター含め、沢山のコメントを頂きまして、当にありがとうございました。 すべてのコメントを読まさせていただきました。 その全てが、ありがたく、身に染みるものでした。 で、今回「ヤフーのトップニュースに載る」ことにより、 「自分のブログ記事の内容が”

    「ヤフコメ」と「はてブコメント」の違い。テキストマイニングより見えてきたもの - プリキュアの数字ブログ
    hagurin_Lv1
    hagurin_Lv1 2016/04/26
    KHcoderで簡単な分析するだけでも面白いなあ。やっぱ高度なことやればいいってもんじゃないよなあ。
  • Excelのダメなグラフでウソをつく法|Colorless Green Ideas

    Excel のグラフで事実を誇張したい場合、3Dグラフを使うと便利だ。というわけで、普通の棒グラフでなく、3D棒グラフを作る。 合格者数の推移を3D棒グラフにしたもの [1] グラフを描く視点を変える この段階だと、まだ「圧倒的な」感じはしない。だが、グラフを描く視点を変えれば、「圧倒的な合格力」を見せつけることができる。グラフを描く視点を変えるには、グラフ上で右クリックをしてメニューを出し、「3-D 回転…」を選ぶ。 「3-D回転…」というメニューからグラフを描く視点を変えることができる。 そうすると、次のような画面が出てくる。この画面の数値をいじることで、グラフの描かれ方が変わる。 数値を変えることで、グラフを描く視点を変え、別の印象を与えることができる。 まずは、「軸の直交」というチェックを外す。そうすると、次のような形のグラフになる。 「軸の直交」というチェックを外したあとの3D棒

    Excelのダメなグラフでウソをつく法|Colorless Green Ideas
  • 最適化超入門

    2. 過去の発表 2014年11月29日 TokyoWebMining #40 2 専門と一切関係ナシ 2chテキストマイニングとまとめサイトの自動生成 セクシー女優で学ぶ画像分類入門 3. 所属 自己紹介 2014年11月29日 TokyoWebMining #40 3 Twitter ID tkm2261 専門 経営工学/最適化 某データ分析会社 業務 分析何でも屋さん 機械学習との出会い 当時の研究が実用性 皆無 精神の逃げ道として 機械学習 を開始 研究が 詰んで、 趣味職に 言語、画像と幅広く 遊んでます

    最適化超入門
  • 競馬の解析をガチでやったら回収率が100%を超えた件 - stockedge.jpの技術メモ

    記事のタイトル通り、競馬で回収率100%を超える方法を見つけたので、その報告をする。 ちなみに、この記事では核心部分はぼかして書いてあるため、読み進めたとしても「競馬で回収率100%を超える方法」が具体的に何なのかを知ることはできない。(私は当に有効な手法を何もメリットが無いのに公開するほどお人好しではないので) 当に有効な手法を見つけたいのであれば、あなた自身がデータと向き合う以外の道は無い。 ただし、大まかな仕組み(あと多少のヒントも)だけは書いておくので、もしあなたが独力でデータ解析を行おうという気概のある人物なのであれば、この記事はあなたの助けとなるだろう。 ちなみに、これは前回の記事の続きなので、読んでない方はこちらからどうぞ。 stockedge.hatenablog.com オッズの歪みを探す さて、前回からの続きである。 前回の記事のブコメで「回収率を上げたいならオッズ

    競馬の解析をガチでやったら回収率が100%を超えた件 - stockedge.jpの技術メモ
    hagurin_Lv1
    hagurin_Lv1 2016/01/18
    暇ができたらこういうのやるのもいいな
  • http://black.ap.teacup.com/akiyah/1825.html

    http://black.ap.teacup.com/akiyah/1825.html
  • シリウス先生の心理統計学

    このwebサイトはMicrosoft Internet Explorerでは正常に表示されることを確認していますが、FirefoxやNetscape、Operaなどのブラウザではうまく表示されないページがあります(画像の位置が変であるなど)。これは使用しているブラウザの問題ではなく、作成している私側に問題がありますが、どうしても見難くてダメという場合以外は大目にみてください。もし、表示されたページが全く読み取れない場合はメールもしくは掲示板を通して連絡してください。

  • 1