タグ

ブックマーク / hagino3000.blogspot.com (6)

  • Data validation for machine learning 読んだ

    Breck, Eric, et al. "Data validation for machine learning." Conference on Systems and Machine Learning (SysML). https://mlsys.org/Conferences/2019/doc/2019/167.pdf . 2019. 読み手のコンテキスト現職で機械学習予測モデルをプロダクトに投入する様になって3年程経った。そうもなると開発時に想定していた訓練データの分布と現状の分布が乖離して、予測の動作不良を引き起すケースがしばしば見られる様になった。明らかな予測の不具合として目立っていなくとも性能が落ちている部分はもっとあるはずで、これに早く気づいて対応したいモチベーションがある。かつ運用専任メンバーはいないので、できるだけ運用は手を抜きたい。概要著者らはData Validat

    Data validation for machine learning 読んだ
    Ehren
    Ehren 2020/07/03
  • 『効果検証入門』がアプリケーション開発エンジニアにとって得る物が多い本だった

    読みました。アプリケーション開発エンジニア視点で読んで同僚に勧められる素晴しい内容でした。稿はエンジニア視点のレビューになります。 効果検証入門〜正しい比較のための因果推論/計量経済学の基礎 技術評論社 (2019/1/18) 安井 翔太 (著), 株式会社ホクソエム (監修) Kindle版/紙版両方あり 目次と構成 序 嘘っぱちの効果とそれを見抜けないデータ分析 1章 セレクションバイアスとRCT 2章 介入効果を測るための回帰分析 3章 傾向スコアを用いた分析 4章 差分の差分法(DID)とCausalImpact 5章 回帰不連続デザイン(RDD) 付録 RとRStudioの基礎 終 因果推論をビジネスにするために まず効果検証とは何かという導入と共にビジネスの現場でありがちな誤りのある検証について解説があります。この誤りの原因となるセレクションバイアスと理想的な比較方法であるラ

    『効果検証入門』がアプリケーション開発エンジニアにとって得る物が多い本だった
    Ehren
    Ehren 2020/05/06
  • ウィルス感染検査とFalse-Positive Paradox

    最近のニュースでウィルス感染症の検査と聞いてまっさきに思い浮かんだのが、母集団の感染率より検査の偽陽性確率が高い時に人間の直感から離れた結果になるパラドックスの話。統計学の教科書にも練習問題として出てくる印象があります。 問題 ウィルス感染検査で陽性となった時に被験者が感染している確率を求めよ。 母集団の感染率は0.1%。検査の性能は感度99%・特異度99%、つまり感染している人は99%の確率で陽性となり、感染していない人は99%の確率で陰性となるものとする。 計算 感染しているか否かを y ∈ {0, 1} 検査結果を x ∈ {0, 1} で陽性が1とする ベイズの定理 より、検査結果が陽性だった時に感染している確率は ここで P[y = 1] = 0.001 感染率 P[x = 1|y = 1] = 0.99 感度 P[x = 1} = 0.001 * 0.99 + (1 - 0.9

    ウィルス感染検査とFalse-Positive Paradox
    Ehren
    Ehren 2020/03/03
  • Spotify社のエンジニア評価制度

    Spotifyが日に上陸しましたね。現在はアプリをインストールしてもすぐにサービスが利用できない様子、その隙に彼等の技術職評価制度についてのブログエントリを読みます。 ブログエントリは3部作になっており、技術職のキャリアパスフレームワークを作ったモチベーションに始まり、そこから得た物まで纏まっています。 印象に残った箇所 キャリアパスフレームワークをいつ作るか 会社の初期の頃にはキャリアパスフレームワークは不要である。しかし8年間、Spotifyは昇格・昇給の正式な手続きが存在しなかった。 昇格にはラインマネージャかプロダクトオーナーになるのが必要だと社員は考える様になってしまった。Spotifyにおいては、それは職種変更同然で開発者としての成長では無い。 2014年の春に "career ladder" の開発に着手した。 目標 Spotifyの文化に適合しており、社員の多様性、さまざ

    Spotify社のエンジニア評価制度
    Ehren
    Ehren 2016/10/17
  • 自転車ポエム

    このエントリはpyspa Advent Calendar 2015の15日目の記事です。pyspa Advent Calendarは「自分が好きなものや興味があるものをなんでもいいので書く」という事で、数年に一度あるか無いかのポエムです。 2014年冬にCannondale SYNAPSE CARBON 5を購入、弱虫ペダルで言うと手嶋先輩が乗ってる奴。そして2015年は輪行を修得した事で行動範囲が一気に拡大した。輪行とは専用の袋に自転車をバラして格納して鉄道などの交通機関に乗る技である。

    自転車ポエム
    Ehren
    Ehren 2015/12/16
  • Tincrを使って、Chrome Developer Toolsでの変更をソースコードに反映する

    --> tree app app ├── 404.html ├── favicon.ico ├── index.html ├── robots.txt ├── scripts │ ├── main.js │ └── vendor │ ├── jquery.min.js │ └── modernizr.min.js └── styles └── main.css Chrome Developer ToolsのTincrタブでProject Typeを選択、Http Serverの場合はルートディレクトリの設定のみ。 Enable Loggingにチェックを入れておくとConsoleタブにログが出てくる。 Content for url http://localhost:8000/scripts/main.js matches local file /Users/tnishibayashi/d

    Tincrを使って、Chrome Developer Toolsでの変更をソースコードに反映する
    Ehren
    Ehren 2013/02/18
  • 1