タグ

rに関するuchiuchiyamaのブックマーク (13)

  • 実務で使う統計手法は、5つ。すごい、そんなシンプル?

    このセミナー、冒頭の渋谷 直正さん(日航空 旅客販売統括部Web販売部 1to1マーケティンググループ アシスタントマネジャー)のお話がとても参考になりました。 まず、渋谷さんはご存知のように、2014年に「データサイエンティスト・オブ・ザ・イヤー」を受賞され、ビジネス・サイドにおける、データサイエンスのリーダー的存在です。 その渋谷さんの「実務で使う分析手法は5つで十分、マーケターこそデータサイエンティスト候補」という講演は、多くの示唆に富んだものでした。 まず、みなさんが気にしている5つの手法とは、 クロス集計 ロジスティック回帰 決定木 アソシエーション分析 非階層的クラスター分析(k-meansなど) の5つです。統計の教科書にはさまざまな手法が出てきますが、マーケターが実務で使うのはこの5つ程度だと説明されるのです。でも、この説明には、私も思い当たる部分があります。東大数学

    実務で使う統計手法は、5つ。すごい、そんなシンプル?
  • R でアトリビューション分析。Google アナリティクスの「コンバージョン経路」レポートを視覚化。 - 廿TT

    アトリビューション分析とは バズワードです。明確な定義はありません。 広告の直接効果だけでなく、間接的な効果も含めて分析しようみたいな意味です。 コンバージョン経路 Google アナリティクスの管理画面を開いて「コンバージョン」→「マルチチャネル」→「コンバージョン経路」を選ぶと、こんなレポートが表示されます。 例えば、「オーガニック検索 > ノーリファラー」は、最終的にコンバージョン(成果)に至ったセッションはノーリファラーだったけれども、その直前のセッションはオーガニック検索だった、という意味です。 こういうのを見るのが最近はやってます。ユーザーのセッション遍歴は「カスタマージャーニー」とか呼ばれます。 R で集計 どのチャネル(訪問経路)がコンバージョンにどの程度寄与しているのか、「コンバージョン経路」のレポートから集計してみます。 データは Analytics すべてのウェブ

    R でアトリビューション分析。Google アナリティクスの「コンバージョン経路」レポートを視覚化。 - 廿TT
  • アドテク部勉強会第1回:『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの | RCO Ad-Tech Lab Blog

    アドテク部勉強会第1回:『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの 2014/10/31TJO 皆さんこんにちは、TJOです。先週10月22日(水)にアドテク部勉強会第1回ということで、拙著の宣伝(笑)と執筆するに当たり私が何を考えていたかといったことを中心にお話しました。 強調したかったのは、スライドの真ん中の辺りで取り上げた「基礎知識」として挙げた2点です。 「集計」と「統計学的分析」の違い 「機械学習」は何を学習するのか もちろん真剣に勉強し始めたら、そして究めようと思ったらキリがありませんし、逆に言えばいくらでも手を抜いてしまえるのがデータ分析というもの。そうは言っても、データマイニングとか統計学とか機械学習とか身に付けると、こういう良いことがあるんですよ~!というのを出来るだけ分かりやすく話してみた・・・つもりです。 最後のペー

    アドテク部勉強会第1回:『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの | RCO Ad-Tech Lab Blog
  • 非エンジニアにもわかるR言語で何ができるか?【データマイニング】 | Sanow Labs blog(サノウラボブログ)

    GMOアドパートナーズ(株)がソーシャルメディア・Web広告戦略を提供するラボサイト!Web広告のトレンドや、SEO/SEM、ソーシャルメディアの最新手法の紹介から、ニュース、インタビュー記事等を掲載していきます。実績を通じて得た経験や専門的且つ、実践的なテクニックを活かして、他社の先を行く実効性のあるマーケティング戦略論を提供します。はじめに 「おむつとビール」 この言葉を聞いて、一体どれだけの人が”ピンと”来るでしょうか。 この言葉は「おむつを買った人はビールを買う傾向がある」という米国におけるマーケットバスケット分析の事例としてよく知られています。 一体どういう事なのかというと、とある店舗の販売データを分析したところ、顧客はおむつとビールを一緒に買う傾向があることが分かりました。その結果を受けて、実際に店舗内でこの二つの商品を並べて陳列したところ、売り上げが上昇したという事例がありま

    非エンジニアにもわかるR言語で何ができるか?【データマイニング】 | Sanow Labs blog(サノウラボブログ)
  • ディスプレイ広告のクリック数改善のためのデザイン最適化に、ポアソン分布 / 負の二項分布によるGLMを使ってみる - 渋谷駅前で働くデータサイエンティストのブログ

    これはディスプレイ広告に限った話ではないと思うんですが、あるPC / スマホ上の何かしらのクリエイティブに対するクリック数がそのデザインの良し悪しによって左右されるということは、web業界ではよく知られているかと思います。 そういう場合「どんなデザインがクリック数を増やすのに有効か?」というのは、厳密にはきちんと条件統制をかけて実験計画法に基づいてデザインしたA/Bテストなどで調べるべきなんでしょうが、そこまで綿密にやっている余裕のない現場も結構多いはず。 そこで、今回は既に計測済みの各広告のクリック数(CTRでしか得られていないようであれば実クリック数に直すものと想定する)データが得られているものと仮定して、それを各広告のデザイン要素を表すインデックス(二値orカテゴリカルデータ)のデータと組み合わせて、「どんなデザインをすればクリック数が増えるか?」を推定するというケースを想定してRで

    ディスプレイ広告のクリック数改善のためのデザイン最適化に、ポアソン分布 / 負の二項分布によるGLMを使ってみる - 渋谷駅前で働くデータサイエンティストのブログ
  • 「真の割合の95%信頼区間」をブートストラップ法で推定するRスクリプト - 渋谷駅前で働くデータサイエンティストのブログ

    「カイゼンしたらコンバージョン率が○○%→△△%にup!」は分母を無視したら成り立たないかもしれない 上記ブログ記事で話題に取り上げた「真の割合の95%信頼区間」の推定ですが、大したコードじゃないので一つのRスクリプト(関数)にまとめてみました。ソースはGitHubに置いてあります。 やってることはものすごく簡単で、要はサンプルサイズが小さい状況で○○%(例えば課金率とか翌週定着率とか)という「割合」の実測値がある場合に、それが統計学的に見て実際にはどれくらいばらつく可能性があるか?をシミュレーションするというものです。 そこで、以下の関数CIComputeに、真の割合の信頼区間を求めたいデータのサンプルサイズnpar、想定される割合nratio、ブートストラップ繰り返し計算回数nbootを与えれば、勝手に真の割合・標準偏差・95%信頼区間上限&下限を返してくれて、ついでにブートストラップ

    「真の割合の95%信頼区間」をブートストラップ法で推定するRスクリプト - 渋谷駅前で働くデータサイエンティストのブログ
  • rubyから統計解析ソフトRを使うためのrrx

    rubyから統計解析ソフトRを使うためのrrx [2014.11.09 rrx ver 1.1を掲載しました。] 最終更新日: 2014/01/05 パッケージ: rrx105.zip 当パッケージは rrx ver 1.05 です。ver 1.04からの修正点については、後の方に掲げてあります。 パッケージは 2013.12.11 にアップロード。2014.01.05 は 対応分析の例・その1と対応分析の例・その2を掲載。 rubyから統計解析ソフトRを利用するためのruby用ライブラリ rrx を作りました。 MS-Windows用のrrxwin.rbの他に、linuxなどで使えるrrx.rbもあります。ただし、後者にはクリップボードを扱う機能がありません。 ruby 1.8.7 | 1.9.3 | 2.0.0, R 2.15.3 で動作確認しました。 統計解析ソフトRは、高機能で統計

  • kkaneko.com

    kkaneko.com 2024 著作権. 不許複製 プライバシーポリシー

  • 統計解析ツール「R」、8年半ぶりのメジャーバージョンアップ版「R 3.0.0」リリース | OSDN Magazine

    4月3日、オープンソースの統計解析ツール「R」開発チームは最新版となる「R 3.0.0」(開発コード「Masked Marvel」)のリリースを発表した。2^31-1以上の要素を持つベクトル(Long Vector)のサポートなどが加わっている。 Rは統計や解析処理、グラフ化のための言語および実行環境。WindowsMac OS X、Linuxなどで利用できる。GNU Projectの1つで、動的型付け、オブジェクト指向などの特徴を持ち、データの操作、計算、グラフィック表示などの機能も統合されている。拡張性が高く、関連パッケージが豊富に用意されている点も特徴で、パッケージはCRAN(Comprehensive R Archive Network)から入手できる。ライセンスはGPL。 バージョン3.0.0は、2004年に公開されたR 2.0.0以来のメジャーバージョンとなる。大きな変更点と

    統計解析ツール「R」、8年半ぶりのメジャーバージョンアップ版「R 3.0.0」リリース | OSDN Magazine
  • R勉強会 Rによる文書モデルの可視化

    Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. R勉強会 Rによる文書モデルの可視化 - Presentation Transcript Rによる文書モデルの可視化 ~ディリクレ分布、混合ディリクレ分布、LDA #tokyoR @nokuno 自己紹介 2  Twitter: @nokuno  はてな:id:nokuno  自然言語処理勉強会を主催(第2回は9/25開催)  PRML/R/Python/Hadoopなど 2002~2006:コミケ同人ゲーム売ってた 2007~2008:未踏でSocial IMEの開発 2009~現

  • Rの並列化の現状について | wrong, rogue and log

    RとHadoopを併用する並列化ソリューションがようやく実用レベルのとば口の一歩手前まできたカンジがある。昨日発表があった、Revolution Analytics(旧REvolution Comupting)のRとHadoopインテグレーションは、並列化処理速度を目指したというよりは、Hadoopの分散ストレージ(HDFS)をうまく使ってテラバイトサイズのデータを解析できるようにしたソリューションだそうだ。 Revolution Analytics Brings Big Data Analysis to R with R http://bit.ly/cD1Pf9 ちなみにRevolution Analyticsとしては、以前の多コア対応を謳っていた並列化ソリューションであるParallelRもサポートをつづけるけれど、主力をこちらのほうにシフトするみたいだね。 いままでも、Amazon

    Rの並列化の現状について | wrong, rogue and log
  • RubyとRで競馬分析

    ここでは、私がJRA-VANのDataLab.サービスを使った競馬分析に使っているRubyとRのスクリプトを公開しています。 RubyもRも各種OSで動作しますが、DataLab.サービスの利用にWindows用のJVLinkを使っている関係上、ここで公開しているスクリプトの動作環境は、Windowsに限定されます。 Rubyスクリプトでは、 (a) JVLinkを使ってDataLab.からデータをダウンロード (b) データの仮処理 (c) COM経由でInternet Explorerを制御してI-PADへの自動投票 などの処理を行なっています。 Rスクリプトでは、Rubyスクリプトで仮処理したデータを元に、統計処理やグラフの描画を行なっています。 Rubyのバージョンはmswin32版1.8.4、Rのバージョンは2.3.1を主に使っています。 ちなみに、私はWindows

  • Ruby + R | アクトインディ技術部隊報告書

    こんにちは。 masudaです。 今回はRubyでRを使うというのをやってみようかなと思います。 RはWikipediaのよると「オープンソースでフリーソフトウェアの統計解析向けプログラミング言語、及びその開発実行環境である。」そうです。 RubyからRを呼び出すためのRSRubyというgemがあります。 これがあるとお手軽にRubyからRの機能を呼び出すことが可能です。 まずはR体をインストールします。 次にRubyGemでRSRubyをインストールします。 オプションでRの場所を指定してあげます。 Macだとこのようになります。 sudo gem install rsruby -- --with-R-dir=/Library/Frameworks/R.framework/Resources 使い方 require 'rubygems' require 'rsruby' r = RSR

  • 1