タグ

2020年7月19日のブックマーク (12件)

  • データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える - Unboundedly

    今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象がおきるので頭の体操としてとても面白いです。 あまりに有名なパラドックスであるため日語でも解説がいくつか出ていますが、人によって言っていることが違っていたり、不完全であったりします。多くはシンプソンによるオリジナルの論文を読んでないことから起因するのだと思います。 例えばシンプソンのパラドックスを交絡の問題だと捉える人は多いですが、個人的に不完全だと思います(間違いではない)。このように誤解が広まった歴史的背景も含めて、詳しく書いていきたいと思います。ちなみにアニメのシンプソンズはこの問題と全く無関係です。 そもそもシンプソンのパラドックスとは? シンプ

    データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える - Unboundedly
    Gln
    Gln 2020/07/19
  • Unboundedly

    2023-07-15 論文を批判的に読むときのチェックリストを公開します 研究 主に医学・疫学・社会科学系の論文を読むときに、こんなことに注目しながら査読やknowledge gap探し(先行研究の弱点を見つけること)をしていますというリストです。 もちろんリストに載っていないポイントに関するコメントも個別ですることはあります。 自… 2023-02-02 「教科書が教えてくれない『交絡』の話」の講義資料を公開しました 因果推論 統計 先日オンラインセミナーで交絡に関するレクチャーをしました。 合計1000人以上に参加していただき、ありがとうございました。 当日の講義資料を公開します。 交絡とは何か、どうやって調整変数を選ぶか、(観察データ分析をする限り必ず生じる)未調整交絡が… 2022-09-24 Target trial emulationの講義資料を公開します 因果推論 研究 統計

    Unboundedly
    Gln
    Gln 2020/07/19
  • 『ICPSRワークショップ(因果推論)』

    前々からこのブログでもお話ししていた通り、5月18日から22日の日程でInter-university Consortium for Political and Social Research(ICPSR)が提供する方法論のワークショップを受講してきました。自分が受けたのはIntroduction to Causal Inferenceというワークショップです。来はヒューストン大学で開講される予定だったのですが、コロナの影響で今回はオンラインで受けることになりました。ヒューストンに行けなかったのは残念ですが、受講料が少し減額されたので、まぁ良しとします(笑) そもそも「なんで因果推論のワークショップ受けてるの?」という話ですが、それは今やってる研究と関係があります。今自分は観衆費用(audience cost)に関するプロジェクトをいくつか持っています。観衆費用とは、国際的なコミットメン

    Gln
    Gln 2020/07/19
  • 近藤誠氏のセカンドオピニオンを受けてみた(東洋経済オンライン) - Yahoo!ニュース

    のがん治療に最も影響を与えた医師として、まず頭に浮かぶのは、「近藤誠」氏の名前である。 この記事の写真を見る 「抗がん剤は効かない」「がんもどき理論」「がん放置療法」など、近藤氏が打ち出す独自理論に影響されて、がん治療を拒否する患者が相次いでいるからだ。 その著書の多くがベストセラーになり、がん患者の間では「近藤信者」と呼ばれるほど熱心な支持者がいる一方で、医療現場の近藤氏に対する評判はすこぶる悪い。 彼は、がん医療の真実を語る孤高の医師なのか、それとも壮大な独自理論で患者を惑わし、患者から正しい治療を奪ってしまう医師なのか──。 いつか直接会って確かめたいと考えていたところ、思わぬ偶然が2つ重なり、直接、自分が近藤氏と対面する機会が生じた。 毎年受診している検査で、私の右肺に小さな白い影が認められたのだ。これまで多くのがん患者の生死を取材してきたが、自分が当事者となって彼らが向き合っ

    近藤誠氏のセカンドオピニオンを受けてみた(東洋経済オンライン) - Yahoo!ニュース
    Gln
    Gln 2020/07/19
  • Python: NumPy 配列の操作でメモリのコピーが生じているか調べる - CUBE SUGAR CONTAINER

    パフォーマンスの観点からいえば、データをコピーする機会は少ないほど望ましい。 コンピュータのバスの帯域幅は有限なので、データをコピーするには時間がかかる。 NumPy の配列 (ndarray) には、メモリを実際に確保している配列と、それをただ参照しているだけのビュー (view) がある。 そして、配列への操作によって、メモリが確保されて新しい配列が作られるか、それとも単なるビューになるかは異なる。 今回は NumPy の配列を操作するときにメモリのコピーが生じているか調べる方法について。 使った環境は次のとおり。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.15.5 BuildVersion: 19F101 $ python -V Python 3.7.7 $ pip list | grep -i numpy numpy 1.

    Python: NumPy 配列の操作でメモリのコピーが生じているか調べる - CUBE SUGAR CONTAINER
    Gln
    Gln 2020/07/19
  • 「ゴーストオブツシマ」発売でネットがお祭り状態! 「敵の倒れ方が時代劇のそれで笑う」「想定していたレベルを超越している」など絶賛の嵐(1/2) | ゲーム ねとらぼ調査隊

    「ゴーストオブツシマ」発売でネットがお祭り状態! 「敵の倒れ方が時代劇のそれで笑う」「想定していたレベルを超越している」など絶賛の嵐(1/2) | ゲーム ねとらぼ調査隊
    Gln
    Gln 2020/07/19
  • テレワークで使う「家庭用ルーター」が危ない! セキュリティ対策をあなどってはいけない理由

    テレワークで使う「家庭用ルーター」が危ない! セキュリティ対策をあなどってはいけない理由(1/2 ページ) 新型コロナウイルス感染症対策として、国内でも多くの企業がテレワークを採用しています。いずれはオフィス勤務に戻す企業も多いと思いますが、中には日立製作所や富士通のように、今後はテレワーク主体で業務を進めると宣言する企業も出てきています。育児や介護といった家庭の事情を抱える従業員を中心に、部分的にテレワークを継続する企業もあります。 テレワーク中でもオフィスで働く時と同様、IT環境のセキュリティ対策は不可欠です。内閣サイバーセキュリティセンター(NISC)はこのほど公開した文書で、「新しい生活様式」に向けたセキュリティ対策の指針を紹介しています。 具体的には(1)テレワーカーの増加や対象業務の拡大があった場合はセキュリティリスクを再評価すること、(2)支給端末・支給外端末に関わらず、利用

    テレワークで使う「家庭用ルーター」が危ない! セキュリティ対策をあなどってはいけない理由
    Gln
    Gln 2020/07/19
  • 元寇でモンゴル帝国が日本人を肉盾に→鎌倉武士「アイツらは人質効くんやな!(平然と肉盾を射る)」合理的だがサイコパス過ぎるのでは

    大刀🔞・ザ・ヒュージザンバー @DAIGATANA 元寇が日人を肉の盾に使う → 分かる 鎌倉武士がそれを平然と射る → まあ分かる(鎌倉武士なので) それを見て「人質を使うという事はアイツらは人質効くんやな!」と分析、こちらも導入する → 分からない 2020-07-18 19:37:29

    元寇でモンゴル帝国が日本人を肉盾に→鎌倉武士「アイツらは人質効くんやな!(平然と肉盾を射る)」合理的だがサイコパス過ぎるのでは
    Gln
    Gln 2020/07/19
  • ラズベリー

    岩手で就職した俺は、何度か転勤をして長野に腰を据えることとなった。 軽井沢という洒落た別荘地の近くに勤務する俺は、独身ながら小さな庭付きの家も購入し、ずいぶんと浮かれていたのだろう。 小さな庭はまだ何も植えられていなく、少し寂しい。何か、べられるものを植えたい。そう思って先輩に相談すると、先輩は静かに言った。 ラズベリーだけはやめておけ、と。 いつも笑っていた先輩が突然無表情になり放った言葉に、俺は困惑した。どうしてと問うと、先輩は答えてくれた。 奴らは繁殖力が恐ろしい。一度根を張ると、他の植物をらいつくす勢いで増えていく。何も手をかけていないのに、だ。 世話をしなくていいなんて、まさに俺向きじゃないですか。そう茶化したのだが、先輩は無表情に首を振った。 そして静かに繰り返す。ラズベリーだけはやめておけ、と。 何だか怖くなり、とりあえず俺は先輩の言うとおり頷いた。 その日の帰宅途中、煌

    ラズベリー
    Gln
    Gln 2020/07/19
  • とあるAIプロジェクトの失敗とそこから得た鬼十則 - Qiita

    私自身もこういったアンチパターンに遭遇し失敗した経験がある。 冒頭にあげた鬼十則はその反省から生まれたものであるが、ここからそれぞれの項目を解説していきたい。 1. データは自ら集めるべきで、与えられるべきではない 主人公の「データがないから開発できない」の発言は間違ってはいない。しかしデータがないと嘆くのではなく、そのデータを取りに行く努力が必要である。昨年データサイエンティスト界隈で話題となった『アルキメデスの大戦』では上のいざこざでデータ(設計図)が手に入らない時、自らデータを集めて突破口を開くエピソードが綴られている5。この姿はまさに理想のデータサイエンティスト像といえるだろう。データ収集の壁は数多く挙げられるが6、その壁を乗り越える努力を怠ってはいけない。自らが安心して開発を進めるためにも、データ取りには十分に入り込んでいくべきである。 2. 目標とは、先手先手と働き掛けていくこ

    とあるAIプロジェクトの失敗とそこから得た鬼十則 - Qiita
    Gln
    Gln 2020/07/19
  • 【VR映画ガイド第7回】ゲーム? 映画? 全く新しい領域のVR映画作品

    こんなにも長くVR空間にいたのは初めてだったかも 「A Fisherman’s Tale」はVRパズルアドベンチャーゲームとして紹介されています。私のようなVR映画を体験したい人間としては「ゲームだし、パズルだし…」という理由で、選択肢から外してしまうコンテンツでした。 しかし昨年のヴェネツィア映画祭で出会った時から気になっていたので、先日Oculus Storeで購入し、最後までやり切ってみました。やり始めた途端、あっという間に2時間、3時間が経ってしまうぐらい没入してしまいました。こんなにも長くVR空間にいたのはこれが初めてだったかもしれません。 深いテーマがありながらきちんと考えられたストーリー。しかも受動的に待てば進むものでは無く、自分も主人公となって多くの困難を乗り越えなくてはなりません。その困難はゲームを楽しませる障害では無く、ストーリーの中で超える必要のあるものになっています

    【VR映画ガイド第7回】ゲーム? 映画? 全く新しい領域のVR映画作品
    Gln
    Gln 2020/07/19
  • Confidence intervals for causal parameters - PubMed

    Gln
    Gln 2020/07/19