タグ

2018年9月25日のブックマーク (3件)

  • ITP 2.0の機能の検証 - NO AD NO LIFE

    はじめに ITP(Inteligent Tracking Prevention)はブラウザ(Safari)上のユーザ行動の追跡を抑止する機能で、2017年に発表された最初のバージョンであるITP1.0は広告業界を震撼させました。 そして、2018年6月4日に新しいバージョンであるITP2.0が発表されました。ITP2.0ではさらに厳しいユーザ行動の追跡抑止機能が追加されています。 ITP2.0の主な機能として、 トラッカー(ユーザ行動の追跡者)により付与された3rd Party Cookieの即時的な排除 Storage Access APIを利用したCookieの管理 ファーストパーティバウンストラッカーに対する保護 リファラヘッダからドメイン以外部分の排除 があります。*1 今回はこれらの機能について、トラッキング環境を擬似的に構築し、動作検証を行なっていきます。 検証環境 macOS

    ITP 2.0の機能の検証 - NO AD NO LIFE
  • TCPパケットを解析して構造化ログでダンプするツール tcpdp を作った - Copy/Cut/Paste/Hatena

    やっと形になってきました。 github.com 「データベースのクエリログを取得したい」 例えば、データベース(RDBMS)のクエリログを取得したいとき一番確実な方法は、そのRDBMSに備わっているログ機構を利用することです。 一方で、全てのクエリログを出力するとなるとそれなりにIO負荷がかかることが予想されるので、負荷状況によってはクエリログ出力(のIO負荷)を別サーバに分離したくなります。 では、どうすればよいかというと、例えば アプリケーションサーバとデータベースサーバの間にプロキシサーバを挟んでそこで記録することでIO負荷を分離する アプリケーションサーバ側で(notアプリケーションで)記録することで(大抵、サーバ台数の多い)アプリケーション側にIO負荷を分散する というような方法を思いつきます。 そこで、「もし、TCPコネクション上に流れている(例えば)クエリログを解析してログ

    TCPパケットを解析して構造化ログでダンプするツール tcpdp を作った - Copy/Cut/Paste/Hatena
  • データサイエンティストが働いて嫌だったなと思う人たち

    コンサルにてアナリストをやった後、データサイエンティストを名乗りながら仕事をしています。そんな中で嫌だったなと思った人たちとプロジェクト 1.医療統計の周りの人 最近はアウトカムでの評価の流れにはなってきたが、まだまだモデルの評価をする事は少ない。 でも何故か相変わらずロジステックとCox回帰をやれればおっけーであり、モデルの精度が当たらなくてもオッズ比と説明変数の 有意差だけでていれば上手く行く分野。 当に心が痛む上、まだまだ「医者でなければ人であらず」が通ってしまい、モデルの説明よりもお医者様のお言葉が1stにきてしまう。また分析プロジェクトの 設計らしい設計があまり出来ないのもつらいところ(モデルの精度が出ていないのにそのオッズ比・有意差に何の意味があるんだと思う)。後日の製薬企業から「何とか工夫で有意差がでないのか!!」 という謎おしかりを受ける・・・いやそんなん無理ですやんと

    データサイエンティストが働いて嫌だったなと思う人たち