タグ

統計学に関するigrepのブックマーク (13)

  • 実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング - エンジニアHub|Webエンジニアのキャリアを考える!

    実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング 実践とともに、データサイエンスに入門しよう!敷居が高いと思われがちなデータサイエンスですが、データの前処理からの手順は意外とシンプルです。記事では、データの前処理や特徴量の作成、モデルの評価・訓練、ハイパーパラメータの調整など、基的な知識をサンプルコードと図表を見ながら学びます。 データサイエンティストとしてのスキルを向上させるには、データの前処理や特徴量の作成、モデルの評価・訓練、ハイパーパラメータの調整など、広域にわたる知識を身に付ける必要があります。 この記事は、そうした知識を「サンプルコードと図表を見ながら、分かりやすく学習できること」を目指して作成されました。記事内では、新米データサイエンティストのOさんが登場して、ある案件のデータ分析を担当します。読者のみなさんも、ぜひOさんと一緒

    実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング - エンジニアHub|Webエンジニアのキャリアを考える!
  • なるほど統計学園TOP

    はじめに 統計のできるまで データの探し方(初級編) グラフの作り方(初級編) 特徴を捉える(初級編) 統計クイズ王!

  • Haskell Data Analysis Cookbook

    Data is everywhere, logging is cheap, and analysis is inevitable. The recipes in this chapter cover how to gather useful data. Read text from a file path CSV JSON XML HTML HTTP GET requests HTTP POST requests MongoDB

    Haskell Data Analysis Cookbook
    igrep
    igrep 2014/06/28
    Haskellの本も増加傾向にあるんだろうか。
  • (非計量さん向けの)統計学の話:バイアス編 - 社会学者の研究メモ

    (今回はですます調でいく。いや行きます。) まずは、私の後輩や知人たちが書いたです。↓ エスノメソドロジー―人びとの実践から学ぶ (ワードマップ) 作者: 前田泰樹,水川喜文,岡田光弘出版社/メーカー: 新曜社発売日: 2007/08/03メディア: 単行(ソフトカバー)購入: 6人 クリック: 1,065回この商品を含むブログ (99件) を見る このなかに、次のような文章があります。 どのような研究に対しても、その主張の妥当性を、そこで採用されている方法と無関係に論じることはできません。だから、「事例の数」やそこから得られる「一般性」を問う前にまず、ある研究が明らかにしようとしていることが、そもそも事例の数によって保証される種類のものなのかどうかということ自体を考えなくてはなりません。 このことは言ってみれば「当然」のことなのですが、研究者の間ではあまり考えぬかれていない重要な論点

    (非計量さん向けの)統計学の話:バイアス編 - 社会学者の研究メモ
  • 社会調査第4回

    東京大学 | 大学院医学系研究科 | 国際保健学専攻 | 人類生態学教室TOP | 2nd 社会調査第4回 「標抽出(サンプリング)の方法」(2001年5月10日) (全部を一括して読む) トップ | 更新情報 | 研究と教育 | 業績 | 計算機 | 写真 | 枕草子 | 著者 | 目安箱 | 書評 | 社会調査 最終更新: 2001年7月26日 木曜日 18時07分 講義概要 何故標抽出を行うのか? ●完全に全数が測れて,コスト的にも問題なく,対象者にも調査者にも負担がないならば,標調査をする必要はない ●ほぼ完全に均質な対象なら1例でよい ●上記どちらにも当てはまらない場合は「標(サンプル)」という「代表性をもった部分」を全体から抽出する作業が必要 上野駅中央改札風景(写真=166,067 bytes, jpeg形式) どんな種類のサンプルがあるか? ●時間的にも空間

  • サンプリングについてのひとつのお話 - 社会学者の研究メモ

    世論調査などでもしばしば「層化二段無作為抽出」という言葉を目にする人は多いのではないだろうか。この手続を簡潔に説明することはなかなか難しいので、何度テキストを読んでもピンとこない、という人は意外に多いようである。その理由の一つは、「単純ランダムサンプリング(unrestricted random sampling)」を最初に説明して、それからその他の抽出法を応用として説明しようとしているからではないか、という気がする。そのせいか、一般の方の中には「母集団の正しい姿を捉えるには単純ランダム抽出が最善で、それ以外は亜流」といった考え方をしている人も多いようだ。 ところが、統計に関わる研究者のほとんどは、実際には「単純ランダム抽出は最善というよりも次善」ということを理解した上でデータを扱っている。それが一般の人には理解しにくい思考プロセスを踏まえているために、いろいろな誤解が生じているようである

    サンプリングについてのひとつのお話 - 社会学者の研究メモ
  • 対応分析法・数量化Ⅲ類の考え方

    対応分析法・数量化法 III 類の考え方 大隅 昇 ohsumi@ss.iij4u.or.jp All rights reserved. Copyright by Noboru Ohsumi (ISM Professor Emeritus) 1.データをどう考えるか -質的データと量的データ- 古典的な統計学では,取得した測定値(実測値,データ)を連続的(continuous)か離散的 (discrete)かに分けて考える.これはその背景に統計的分布(確率分布)を連続的分布と考え るか離散的分布と見るかという考え方があるからである.前者の例が正規分布や指数分布であ り,後者の例として二項分布やポアソン分布などがある. 具体的な測定例でいうと,身長や体重を測定したデータは連続量とみなし,また電話の呼数 や車の台数などは離散量と考える.また,品質管理などの分野では,これを計量的,計数的

  • Microsoft Word - 第26対応分析.doc

    [ 連載 ] フリーソフトによるデータ解析・マイニング第 26 回 R と対応分析 1 .対応分析とは 対 応分析(correspondence analysis)は、フラ ンスのベンゼクリ(Benzécri)によって 1960 年 代に提唱され、 1970 年代から普及し始めたカテ ゴリカルデータの解析方法で、コレスポンデン ス分析とも呼ばれている。 類 似の方法としては、 1950 年代に林知己夫氏 によって提案された数量化Ⅲ類、 1980 年代に西 里静彦氏によって提案された双対尺度法 (dual scaling) などがある。それぞれの方法が提案さ れた背景は異なるが、基的なアプローチおよ びアルゴリズムの中核は同じである。 デ ータ形式によっては、それぞれの手法の解 析結果は変換によって一致させることも可能で ある。一時的には、数量化Ⅲ類と対応分析は異 なるデータ分析方法

    igrep
    igrep 2011/05/07
    "基本的考え方は、分割表において、行の項目と列の項目の相関が最大になるように、行と列の双方を並び替えることである。問題解決のアプローチは、主成分分析、因子分析とほぼ同じ"
  • 「5%有意水準のもとで有意」を日本の法廷は「5%も例外があるならそれは重要だ」と曲解する(追記あり) – 大「脳」洋航海記

    【科学】 2010年8月25日 司法関係者が統計学を理解できないと – サイエンスポータルレビュー この記事にはちょっとびっくりしました。何がびっくりしたって、記事中で紹介されている法廷の現場における科学者の証言の扱いについてです。 最初の基調講演者、津田敏秀・岡山大学大学院環境学研究科教授の指摘からも事態の深刻さが読み取れた。津田氏は疫学が専門の医師として、水俣病を初めとする多くの環境裁判の法廷で証言してきた経験を持つ。 氏の指摘の中で、多くの人がありそうだと感じるだろう、と思われることがあった。裁判官を含む司法関係者の多くが、疫学の基である統計学を理解していないということだ。確率というものが理解できない結果、「95%の確率でこれこれのことが言える」という科学者の証言に対し、「では残り5%はどうなのか」といったやりとりにしばしば論点が移され、結果的に「5%」の方が勝ってしまうことが「日

  • 10行でナイーブベイズ 〜Rって便利だね!〜 - あらびき日記

    この記事は abicky.net の 10行でナイーブベイズ 〜Rって便利だね!〜 に移行しました

    10行でナイーブベイズ 〜Rって便利だね!〜 - あらびき日記
    igrep
    igrep 2011/04/09
    理解できてないけどとにかくぶくま!
  • Amazon.co.jp: データ分析のための線形代数: 岡太彬訓: 本

    Amazon.co.jp: データ分析のための線形代数: 岡太彬訓: 本
  • M77: Situs Slot Bonus New Member 100 di Awal To Kecil 5x 2023

    Situs Slot Bonus New Member 100 M77 termasuk salah satu situs judi online slot yang menyediakan game paling gacor dan mudah sekali untuk mendapatkan winrate. Situs ini amat terpercaya karena sudah mempunyai legalitas yang resmi. Karena itulah, saat bergabung di dalam situs online slot tersebut untuk bermain online slot, maka Slotter akan amat aman dan nyaman. Selain itu juga situs predikat akan me

  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • 1