タグ

統計に関するnaoeのブックマーク (9)

  • Baseball LAB[ベースボールラボ]プロ野球×データ 選手成績など情報が満載

    Baseball LABの運用に関するお知らせ 平素よりBaseball LABをご利用いただきまして誠にありがとうございます。2021年シーズンより、下記コンテンツ…

    Baseball LAB[ベースボールラボ]プロ野球×データ 選手成績など情報が満載
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • 生還した戦闘機が教えてくれること ~ 選択バイアスの罠 - Feel Like A Fallinstar

    久しくご無沙汰しておりました。 書くネタ自体は山ほどあるんですが、業が凄い勢いで動いているのでそっちに集中していましたです。 さて、たまには分析チックなお話を。統計でガチガチの石頭になってしまわないように、常に僕が気をつけていることの1つが「選択バイアスの罠」です。 生還した戦闘機、しなかった戦闘機 あ、ちなみに、いまきは別に統計や分析の(アカデミックな意味での)専門家ではないので、そのあたりはご容赦を(汗 時に1940年ごろ。 世界は第二次世界大戦の真っ只中です。 統計学者のエイブラハム・ワルドという方が戦闘機の脆弱性について調査していたそうです。 帰還した戦闘機の大量のデータが彼の元に届きます。 「入手したデータどれもが、戦闘機のある部分の被弾頻度が他の部分よりも過度に多いことを示していた。」 さて、ここからどういう結論を導けばいいのでしょうか? (ちょっと立ち止まって考えてから読ん

  • 統計数理研究所 - 公開講座「計量社会科学入門」

    統計数理研究所TOP 統計数理研究所は高度な知識とスキルを持ったデータサイエンティストを育成するプログラムを積極的に推進しています。 統計科学の最先端理論・手法から基礎的なものまでを学べる多様な一般講座の他、系統的な講座編成により現代的な統計科学の姿を示すリーディングDAT講座を実施します。また、医療健康データ科学研究センターの講座も開講します。 リーディングDAT講座と一般講座は受付が始まったら統計数理研究所公開講座のX(旧Twitter)でお知らせいたします。 過去の公開講座は こちら からご覧いただけます。 リーディングDAT講座 ※2024年度の詳細は決定次第公開いたします。2023年度の情報はこちら 2017年度までの「統計学概論」は発展的にこの講座に吸収されました。 一般講座 日程等変更となる可能性があります。お申込前に必ず確認して下さい。 医療健康データ科学に関わる人材育成事

  • フィッシャーの線形判別 - 人工知能に関する断創録

    今回は、4.1.4のフィッシャーの線形判別を試してみました。これは、他の手法と少し毛色が違う感じがします。まず、D次元の入力ベクトルxを(4.20)で1次元ベクトル(スカラー)に射影します。ベクトル同士の内積なので結果はスカラーで、wはxを射影する方向を表します。 フィッシャーの線形判別は、射影後のデータの分離度をもっとも大きくするようなデータの射影方向wを見つけるという手法だそうです。 クラス1のデータ集合C1の平均ベクトルとクラス2のデータ集合C2の平均ベクトル(4.21)をw上へ射影したクラス間平均の分離度(4.22)を最大にするwを選択するのが1つめのポイントのようです。式(4.22)の左辺はスカラーです(フォントの違いがわかりにくい)。 wは単位長であるという制約のもとで(4.22)を最大化するようにラグランジュ未定乗数法で解くと、 という解が得られます(演習4.4)。これは、ベ

    フィッシャーの線形判別 - 人工知能に関する断創録
  • 分類における最小二乗 - 人工知能に関する断創録

    4.1節は、データから識別関数を直接的に構成するアプローチとして、 最小二乗法 フィッシャーの線形判別 パーセプトロン が紹介されています。すべて線形識別モデルなので二次元なら直線、三次元なら平面、それ以上なら超平面で分離できる、つまり、線形分離可能なデータしか分類できない方法です。私が昔、機械学習を勉強していたときはこれがメインだったのでこっちのアプローチが一番自然な感じがして、ベイズ的なアプローチの方が新鮮に感じていました。 ここで出てくるパーセプトロンは、Rosenblattが提案したやつでMinskyとPapertに「線形分離しかできないじゃないか!」と批判されたアルゴリズムですね。線形分離不可能なデータにも対応できるRumelhartの多層パーセプトロンは5章のニューラルネットワークに、サポートベクトルマシン(SVM)は下巻の7章に出てくるようです 今回は、4.1.3の分類におけ

    分類における最小二乗 - 人工知能に関する断創録
  • http://blog.chase-dream.com/2010/04/28/961

    http://blog.chase-dream.com/2010/04/28/961
    naoe
    naoe 2010/04/28
  • サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ
  • 素人の僕が、データ分析に自信を持つようになったある発見 - 人と組織と、fukui's blog

    2010年03月13日 22:01 カテゴリ事業家養成講座 素人の僕が、データ分析に自信を持つようになったある発見 Posted by fukuidayo Tweet 僕は1999年に就職活動をしました。会社は全部で8社ぐらい?受けたのかな。 受かった会社の選考よりも、落ちた会社の選考のほうが覚えているもので、あるシンクタンクを受けたときに提出したレポートの出来の悪さと、あるコンサルティング会社を受けたときに出たケーススタディーの答案を前に、頭が真っ白になったときのことは、今でもたまに思い出します。 どうやって分析し、自分の見解を示せば良いのか、まるでわからなかったのです。 それから数年がたち、僕はケーススタディーを受ける側ではなく、つくる側になりました。 データの見方を教え、伝える側になったのです。 そうなれたのは、データを分析する。ということに関して、助言を与え続けてくれた先輩・上司

  • 1