タグ

分析とIRに関するhigh190のブックマーク (13)

  • 統計解析の再現可能性を高める取り組み

    統計解析の再現可能性を高める取り組み 1. 統計解析の再現可能性を 高める取り組み 専修大学人間科学部心理学科 国里愛彦 2017/7/8 臨床疫学研究における報告の質向上のための統計学の研究会 第30回「Rを用いたデータハンドリング入門:効率的かつ再現性の高い統計解析のための第一歩」 2. 再現性の危機 • 心理学研究 のうち再現されたのは • 引用数が多く効果があるとされた臨床医学研究 のうち再現されたのは • 名の調査から, が他の研究者の研究を再 現できず, が自分の研究の再現もできなかった 3. と • 再現可能性 :ある現象が他の研究者 が行った研究でも再現されること(新規なデータ収 集あり) • 再生可能性 :データから解析結果 が再生できること(新規なデータ収集なし。コードや データの共有などで確認する) →今回は,再生可能性について扱う Peng, R. D.

    統計解析の再現可能性を高める取り組み
  • http://iir.ibaraki.ac.jp/jcache/documents/2018/iries2018/files/1-03_suzuki.pdf

    high190
    high190 2018/02/28
    "公開データの効率的なデータ変形(RESHAPING)について"
  • 提言「社会調査をめぐる環境変化と問題解決に向けて」(平成29年9月19日) | 日本学術会議 社会学委員会 社会統計調査アーカイヴ分科会

    提言 社会調査をめぐる環境変化と問題解決に向けて 平成29年(2017年)9月19日 日 学 術 会 議 社会学委員会 社会統計調査アーカイヴ分科会 i この提言は、日学術会議社会学委員会社会統計調査アーカイヴ分科会の審議結果を取 りまとめ公表するものである。 日学術会議社会学委員会社会統計調査アーカイヴ分科会 委員長 佐藤 嘉倫 (連携会員) 東北大学大学院文学研究科副研究科長 副委員長 石井 クンツ 昌子 (連携会員) お茶の水女子大学基幹研究院人間科学系教授 幹 事 青柳 みどり (連携会員) 国立研究開発法人国立環境研究所社会環境システム研 究センター主席研究員 幹 事 稲葉 昭英 (連携会員) 慶應義塾大学文学部教授 町村 敬志 (第一部会員) 一橋大学大学院社会学研究科教授 阿部 彩 (連携会員) 首都大学東京都市教養学部人文・社会系教授 今田 高俊 (連携会員) 東京

  • 企業のデータ活用の成否を決める1つの重要な概念

    東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。 待望の新刊『統計学が最強の学問である[ビジネス編]』無料公開 ベストセラーとなった『統計学が最強の学問である』の第三弾『統計学が最強の学問である[ビジネス編]』が、ついに9月中旬に発売。その内容を無料公開します。真にビジネスに役立つ「統計力」を身に着けるためにはどうしたらいいのか。著者・西内 啓氏の斬新な視点をあますところなくお伝えします。 バックナンバー一覧 累計45万部を突破し

    企業のデータ活用の成否を決める1つの重要な概念
    high190
    high190 2017/05/11
    リサーチデザインの重要性についての指摘
  • 資料2 ノーベル賞受賞者についての論文分析

    high190
    high190 2016/12/08
    科学技術・学術審議会第8期国際戦略委員会の配付資料。
  • RIETI - 出身大学、職務評価、昇進:雇用者学習モデルの人事データを用いた推定

    このノンテクニカルサマリーは、分析結果を踏まえつつ、政策的含意を中心に大胆に記述したもので、DP・PDPの一部分ではありません。分析内容の詳細はDP・PDP文をお読みください。また、ここに述べられている見解は執筆者個人の責任で発表するものであり、所属する組織および(独)経済産業研究所としての見解を示すものではありません。 人的資プログラム (第三期:2011~2015年度) 「企業内人的資源配分メカニズムの経済分析―人事データを用いたインサイダーエコノメトリクス―」プロジェクト 会社内での出世を決めるのは出身大学か、入社後の業績か? この疑問に答えるため、研究では雇用主が各ホワイトカラー従業員の能力を出身大学と上司からの評価を組み合わせることで推測し、能力が高いと判断されたものを昇進させるというモデルを構築し、そのモデルパラメータを製造業大手2社の人事データを用いて推定した。 図1に

    high190
    high190 2015/03/13
    "教育のシグナリング効果の大きさを数量的に明らかにした世界初の論文であり、学術的貢献も大きい"
  • RIETI - University Prestige, Performance Evaluation, and Promotion: Estimating the employer learning model using personnel datasets

    雇用主学習モデルは雇用主が、従業員の能力についての先験的分布を学歴から形成し、職務のパフォーマンスを観察しながらその分布を更新していくと仮定する。論文は各従業員の出身大学、職務評価、職能等級に関する豊かな情報を含んだ2つの大規模製造業企業の人事データを用いて、大卒ホワイトカラー労働者についての雇用主学習モデルのパラメータを推定した。推定の結果は雇用主は従業員の能力を素早く学習することを示しており、当初の予測誤差は3年から4年のうちに半減する。企業は名門大学の卒業生を早く出世させるがそれは名門大学の卒業生が一般的に職務上のパフォーマンスがよいためである。 The employer learning model postulates that employers form employees' prior ability distribution from educational crede

    high190
    high190 2015/03/12
    企業は名門大学の卒業生を早く出世させるがそれは名門大学の卒業生が一般的に職務上のパフォーマンスがよいため
  • 1000人受講、大阪ガス「ビッグデータ研修」を追体験 - 日本経済新聞

    ビッグデータ分析に力を入れる多くの企業が関心を寄せる社内研修がある。大阪ガスの「データ分析講習」だ。一般社員を対象としており、これまでに開催された約40回の研修には、グループ社員を含む、のべ1000人以上が参加。2日間にわたってデータリテラシーを磨く。研修では特にデータ分析を実行する「前後」の工程に注目。分析の「設計図」を描き、利用するデータを事前にチェックする大切さを学ぶ。記事では、研修で使われた240枚のスライドから厳選した8枚を紹介し、研修を追体験できるようにした。

    1000人受講、大阪ガス「ビッグデータ研修」を追体験 - 日本経済新聞
  • データ分析、即エクセル入力が「ご法度」のわけ 受講者数は1000人超え 大阪ガス「ビッグデータ研修」の要諦 - 日本経済新聞

    「いきなりエクセルで計算を始めてはいけません。最初に"外れ値"がないかチェックしましょう」――。大阪ガスの「データ分析講習・上級コースA」の1コマだ。大阪ガスは社員のデータリテラシー研修に心血を注いでいる。基礎講座の受講者は1000人を超え、ビジネスの現場で成果を上げてきた。今回は中堅社員向けに実践的な分析手法をまとめた「上級コースA」の様子を紹介する。約150枚あるスライドのなかから抜粋した9枚を見ながら、研修を追体験していこう。

    データ分析、即エクセル入力が「ご法度」のわけ 受講者数は1000人超え 大阪ガス「ビッグデータ研修」の要諦 - 日本経済新聞
  • 機械学習によるデータ分析まわりのお話

    2. データサイエンティスト 2 今世紀でもっともセクシーな職業 ハーバード・ビジネス・レビュー 2013年年2⽉月号 2018年年までに⽶米国で14〜~19万⼈人不不⾜足 マッキンゼー 2011年年5⽉月 求められるスキル ビジネススキル,機械学習/ビッグデータ, 数学/OR,プログラミング,統計 Analyzing the Analyzers, O’reilly 2013 4. ⽇日お話すること 4 1. データのこと Keywords: ダミー変数,⽋欠損値,正規化,次元の呪い 2. 機械学習のこと Keywords: 機械学習の分類,アルゴリズム,注意点 3. 評価のこと Keywords: 混同⾏行行列列,適合率率率,再現率率率,F値,ROC曲線 4. 分析のこと Keywords: 過学習,交差検証,学習曲線,バイアス・バリアンス 教師あり学習(後述)寄りの内容が多いです

    機械学習によるデータ分析まわりのお話
  • データ分析で大切な4つのこと:1. 「当たり前の結果」をたくさん出す事の大切さ - トレジャーデータ(Treasure Data)ブログ

    データ分析で大切な4つのこと トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 ここ数年,データの大量な蓄積とそれに対する分散並列処理が可能な環境が成熟してきました。元々はデータの蓄積やバッチの効率化といった分析バックエンド(プラットフォーム)の方にフォーカスがあてられてきましたが,やっとその先のデータ」「分析」というところ,そしてその役割を果たすデータ分析者の重要性が理解されるようになってきているように感じています。 このブームは分析者にとって非常に喜ばしいことでもあると同時に,大きなプレッシャーにもなっているような気がします。 そのプレッシャーの1つに,企画者や経営者・あるいは顧客といった結果を活用する人々(=意志決定者)の,「これだけ材料(データ)が揃っているのだから多くの課題が解決できるはずだ」という期待に応えないといけないというプレッシャーがあると思いま

    データ分析で大切な4つのこと:1. 「当たり前の結果」をたくさん出す事の大切さ - トレジャーデータ(Treasure Data)ブログ
    high190
    high190 2014/12/02
    「分析者の考える当たり前の半分は意志決定者にとって当たり前ではなく,またその逆もしかり」
  • データ分析というお仕事のこれまでとこれから(HCMPL2014)

    ハッカーズチャンプルー2014でお話してきた内容です。「データサイエンティスト(カナ)はオワコン」 http://hackers-champloo.org/program.htmlRead less

    データ分析というお仕事のこれまでとこれから(HCMPL2014)
  • 京都大学の各学部の留年者数等に関するデータ - zekipedia

    大学の後輩がブログでネット上に転がっている京大に関する資料を紹介していて、色々と見ていたんだけれども、京都大学の各学部・研究科の留年者数や退学者数のデータが中々面白かったので分析してみました。 ちなみにデータ元はこれです。 ❏ 4-4-1.pdf 一応kyoto-u.ac.jp上で公開されています。(2013/04/14確認済み) 追記 何も考えずに留年率を出す時に留年者数を全学生数で割ってたんですが、卒業者数で割るべきではという指摘がありました。 @zekitter 留年率なのですが在籍者数ではなく卒業者数で割る(ある人が卒業までに留年を経験する確率、より正確には卒業が遅延する平均の年数)と感覚的にわかりやすいと思います— ほにゃちょさん (@honyacho) 2013年4月13日 確かにそっちの方が留年率の感覚としては近そうです。今の計算だと、1〜4回生の留年確定者が反映されてないで

    京都大学の各学部の留年者数等に関するデータ - zekipedia
    high190
    high190 2013/04/15
    教学IRのケーススタディ
  • 1