タグ

ブックマーク / qiita.com/_jinta (3)

  • 効果検証のための因果推論手法のチートシート - Qiita

    効果検証においてABテストによる単純比較以上のことをやろうすると、因果推論の各種手法を用いることになります。しかし、因果推論は主義や用語などが統一されておらず、いつ何を使えばいいかが分からないというハードルがあります。 そんな因果推論の手法を整理し、初~中級者にとって学習・活用の見通しが立てやすいようにまとめたものが記事です。 2023/12/6追記 もともとこの記事は「もう迷わない!効果検証のための因果推論手法のチートシート」というタイトルだったのですが、"迷わない" はどう考えても言い過ぎだったので、タイトルを修正しました。沢山手法があるけど違いが分からなくて混乱しがち、というのが執筆のモチベーションです。むしろ 迷子のお伴 として活用していただけると幸いです。 特にフローチャートの部分は、これに従っておけばOKという主張ではなく、あくまで手法間の関係を整理するためのもの、そしてこう

    効果検証のための因果推論手法のチートシート - Qiita
  • tidyverseの経過を出力してくれるtidylogをアレンジする - Qiita

    tidylogとは tidylogという面白便利ツールがあります。 tidyverseはとっても便利ですが、今どこが実行されているか知りたい、実際どんな流れでどんな処理が行われているか知りたい、という場合にそれを出力してくれるのがtidylogです。 library(tidylog) data <- mtcars %>% select(mpg, cyl, hp, am) %>% filter(mpg > 15) %>% mutate(mpg_round = round(mpg)) %>% group_by(cyl, mpg_round, am) %>% tally() %>% filter(n >= 1) library(tidyverse) の代わりに用いることで、select() でどの列を省いたかだとか、filter() で何行削ったかなどを教えてくれます。 tidylogの出力をア

    tidyverseの経過を出力してくれるtidylogをアレンジする - Qiita
    Aobei
    Aobei 2023/06/29
    SASのログみたいなのかな。
  • 超高速…だけじゃない!Pandasに代えてPolarsを使いたい理由 - Qiita

    PolarsというPandasを100倍くらい高性能にしたライブラリがとても良いので布教します1。PolarsRustベースのDataFrameライブラリですが、記事ではPythonでのそれについて語ります。 ちなみにpolarsは白熊の意です。そりゃあまあ、白熊と大熊比べたら白熊のほうが速いし強いよねってことです2。 何がいいの? 推しポイントは3つあります 高速! お手軽! 書きやすい! 1. 高速 画像はTPCHのBenchmark(紫がPolars)3。 日語でも色々記事があるので割愛しますが、RustやApach Arrowなどにお世話になっており、非常に速いです。MemoryErrorに悩まされる問題も解決されます。開発者のRitchieがしゃれおつなツイートをしてるので、そちらも参考にどうぞ ↓ 4。 抄訳: (ひとつ目)Pandasは黄色くした部分でDataFram

    超高速…だけじゃない!Pandasに代えてPolarsを使いたい理由 - Qiita
  • 1