タグ

統計とネタに関するshibacowのブックマーク (2)

  • 誤解しやすかったり紛らわしかったりする統計の話達 - Interdisciplinary

    統計の話題で、こういう誤りをよく見るなあ、とか、ここら辺はややこしいなあ、的なものを、エッセイ風に書いてみます。 各トピックの最後に、参考資料を紹介したりします。 色々な話題を扱うので、エントリー全体で、このくらいの知識を持っている層向け、みたいな想定はしていないです。下に行くほど、知っている人向けになる、という感じ。 標数と標の大きさ 調べたい集団全体から採り出した個体の数の事を、標数と書くのをよく見かける。でも正確にはこれは、標の大きさと言う。この違いは、標という言葉をどのように捉えるか、に起因するもの。標を、調べたい集団に属する要素と考えるか、含まれる集合と捉えるか。前者で考えると標数を使う事になるけれど、抽出した集まりそのものを標とすれば、標数とは言えなくなる。で、集合に属する要素の数の事を、集合論では大きさというので、それを踏まえて、標の大きさと言う。 たとえ

    誤解しやすかったり紛らわしかったりする統計の話達 - Interdisciplinary
  • 究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.

    ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推

    究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.
  • 1