この記事のモチベーション RStudioでRをメインに使用しているが、やりたいことがPythonでシンプルに可能である場合に、RとPythonのいいとこ取りをしたい。 Pythonで作成したデータフレームをRに読み込んでRの慣れた環境で解析できるようにしたい。 問題点 Pythonのpandasはデータ分析のライブラリを収載したパッケージである。 RStudio上でPythonでのpandas作成したデータフレームをreticulateライブラリで読み込むことはできるが、Pythonのデータフレーム名をそのままRで読み込むと、全く形式が異なってしまいRで再利用できない。 Rで作成したデータフレームはPythonで読み込み可能であることから、PythonからRのデータのやり取りをスムーズに行いたい。 解決方法 参考記事に記載のPythonで作成したデータフレームをRで読み込める形のファイル(
テレビCMの効果測定 例:テレビCMの効果測定 広告の残存効果(アドストック) 定式化 具体例でみる 忘却率をどうやって決めるか 1. 忘却率ごとに相関を出して最適化する(定量的) 2. 商材・メディア・クリエイティブなどに合わせて決める(定性的) 半減期 さいごに 付録:Ad Stockを最適化するスクリプト Python R テレビCMの効果測定 昨今の広告市場を席捲しているデジタル広告市場においては、「効果測定」をしろと言われたば、 CVR(コンバージョン率)やCPA(獲得単価)など、極めて精緻で細やかな指標を用いてレポートすることができる。 そのため、広告をどれだけ出稿するかの意思決定を正確なデータに基づいて行え、大変使い勝手がよい。 しかしながら、このようにデータが整備されているデジタル広告と異なり、 新聞、雑誌、ラジオ、テレビなど古来からのメディアの効果測定はデータ分析にひと工
概要 R で tidyverse (dplyr+tidyr) に使い慣れているが, Python に乗り換えると pandas がどうも使いにくい, と感じている人の視点で, Rの dplyr などとの比較を通して, pandas の効率的な使い方について書いています. そのため, 「R ユーザーへの」と書きましたが, R経験のない pandas ユーザーであってもなんらかの役に立つと思います. また, 自社インターン学生に対する教材も兼ねています. どちらかというと, 初歩を覚えたての初心者向けの記事となっています. データ分析は一発で終わることはまずなく, 集計・前処理を探索的に行う必要があります. よって, プログラムを頻繁に書き直す必要があり, 普段以上に保守性のある書き方, 例えば参照透過性を考慮した書き方をしたほうが便利です. R の tidyverse の強みとして, 再帰代
There’s clearly some relationship between the values plotted in X and Y, but regular correlation coefficients like Pearson’s would return a score close to 0. However, the Predicted Power Score coupled to a proper model can identify the correlation. Figure drawn by the author. The Predictive Power Score (that I will just abbreviate as PPS hereafter) is a statistical metric used to measure the stren
0. はじめに 1. 対象データ 2. 先に各手法の結果を確認 3.準備 4. 基礎集計~CMを見た人と見ていない人での目的変数の差~ 5. 因果推論の流れのおさらい 6. 傾向スコアモデリング 6.1 モデリング 6.2 テスト / コントロールの傾向スコアの可視化 6.3Rでの傾向スコアモデリングの実装 7. 傾向スコアマッチング 7.1 結構面倒なpython 7.2 R (Matchingライブラリ) 7.3マッチングの評価 8.IPW 9. ダブルロバスト 9.1 回帰モデル 9.2ダブルロバスト 10.Proximityマッチング 11.改めて、各種手法による推定因果効果のまとめ 12.まとめ 0. はじめに 理論編に引き続き、実装を行なっていきます。 pira-nino.hatenablog.com 実装はpythonとRの両方で行いました。 作業用のコードは以下のgithu
はじめに dfplyすごい 以前からR, とりわけdplyrユーザーのpandas操作のために記事をまとめてきましたが、dplyr同様の操作は実現できていませんでした。**が、**ついにdfplyという素晴らしいライブラリを見つけましたので記事にまとめます。 関連シリーズ dplyr使いのためのpandas dfply データ加工編(tidyr) [dplyr使いのためのpandas dfplyでもJOIN編] (https://qiita.com/T_Shinomiya/items/cca75a0bd1b0b1663dbf) [dplyr使いのためのpandas dfply window関数編] (https://qiita.com/T_Shinomiya/items/327cc073e8079eabe242) 以前の記事はコチラ dplyr使いのためのpandas 基礎編 dplyr使
概要 reticulateパッケージはPythonを活用するRのパッケージ reticulateパッケージの使い方とライブラリ利用例を実行結果を提示して確認 試したライブラリはSentence Piece, Pytorch, AllenNLPなどは動作している (本記事ではRを「パッケージ」とPythonを「ライブラリ」という風に書き分けています) 前書き 有用なライブラリがPythonで開発されているため使いたくなりますが、Pythonはわからない・書けないというRユーザーは未だに多くいらっしゃいます。 しかしながら、すでにあるPythonライブラリの関数にデータを適用した結果だけが欲しいのであれば、reticulateパッケージで事足りてしまうようです。 同様のパッケージには以前に紹介したPythonInRやrPythonなどがありますが、reticulateがリリースされてからは私は
こちらをご覧ください。踏み絵ではありません。R上で地理空間データを扱うPythonモジュール、geopandasによる作図を行なっている画面です。 え、RでPythonを!?と驚かれる方もいるかもしれませんが、reticulateというRパッケージを使うことで、ほぼストレスフリーでPythonのモジュールや関数がR上で利用可能になります。先の図は次のコードによって実行されました。 library(reticulate) # モジュールの呼び出し gpd <- import("geopandas") plt <- import("matplotlib.pyplot") # サンプルデータの読み込み world <- gpd$read_file(gpd$datasets$get_path("naturalearth_lowres")) # データセットの確認 head(world) # ではな
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く