最近盛り上がりを見せるデータサイエンス界隈。 様々なpodcastが存在しているが、あまり言及されることが無いようなのでここでまとめておく。 割と更新頻度が高いものを中心に選んだつもりなので、これらを購読すれば聞くものが無いという状態にはなかなかならないかと思う。 言語は英語なので、データサイエンスの最新動向を知るのとともに英語の勉強にも使えるかと思う。 日本の機械学習エンジニアと研究者が世界と戦うための一助になれば幸いです。 Super Data Science
この記事は以下の記事の続きです。 前回の記事では普通にロジスティック回帰で傾向スコアを求めたのですが、傾向スコアというのは元はと言えば「共変量に基づいてそれぞれの群に割り付けられる確率値を求めたもの」なので、やろうと思えば機械学習分類器で代替しても良いわけです。実際、岩波DS3にもそのように書かれています。 岩波データサイエンス Vol.3 岩波書店Amazon ということで、前回記事のCM接触データセットに対して任意の機械学習分類器を用いて傾向スコアを算出した歳の、各種効果指標の違いを見ていこうかと思います。なおデータセットは前回から引き続きdというデータフレームに入っているとします。またAUCを求めるに当たっては{ROCR}パッケージを用いています。下準備として以下のようにインデックスを用意しておきます。 > ivec1 <- d$cm_dummy # Treated group >
今年の3月24日、25日に開催予定のイベント、Experience Design 2016 SPRING(通称:XPD2016 SPRING)。これまで様々な切り口から、UXとCXの今を考えてきましたが、今年は「データ」に注目。「Data × Design」をテーマに、未来を描き続ける経営者、サイエンティスト、プロダクト開発者などを迎えて参加者と一緒に考えていきます。今回はその登壇者の1人、株式会社ディー・エヌ・エー(DeNA)で機械学習活用したサービス開発で活躍している濱田晃一氏を訪ね、普段どのようにデータ活用をし体験のデザインに関わっているかを伺いました。 ー まず最初に、普段はどのような仕事をしているのか教えていただけますか? DeNAの全サービスを対象として、機械学習を活用したサービス開発を行っています。DeNAはMobageなど、利用ユーザー数が数千万人を超える複数のサービスを運
前回から大分、間があいてしまいましたが、 Pythonでデータサイエンス続き編です。 前回のアソシエーションルールまでで、 本編は一通り終了しました。 残りは10章に載っている、 様々な手法に触れてみよう編です。 手を動かしながら学ぶ ビジネスに活かすデータマイニング 作者: 尾崎隆出版社/メーカー: 技術評論社発売日: 2014/08/22メディア: 単行本(ソフトカバー)この商品を含むブログ (6件) を見る 今回はベイジアンモデリング 教科書はこれ、ですが、ベイジアンモデリングそのものの説明は最小限でした。 準備 Pythonでベイジアンモデリングを用いるには、 MCMCを扱えるpystanを使用します。 これは重力波の研究にも使われたツールで、 StanというMCMCを扱うライブラリのPythonラッパーです。 andrewgelman.com pipで入ります。 pip inst
【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本本機械学習数学データ分析データサイエンス Update版2023年版データ分析の100冊を書きましたよ! 必読10冊を更新。データサイエンス、データ分析、機械学習周りでおすすめ図書10選のような記事は良く見ますが、網羅的な紹介記事はあまり見かけないので自分が欲しいと思い書きました。私よりたくさん読んでいる方は多々いらっしゃると思いますが、記事を書いてくださいな。 別の観点でデータ分析プロジェクトのフェーズ毎の参考書籍紹介という記事を新たに書きました。 データ分析の各フェーズ(データ分析プロジェクト全体-ビジネス状況の理解-データの理解-データの準備-モデルの作成-評価-展開)毎に参考書籍を紹介しています。 本記事の対象と想定 Qiitaはプログラマやコンピューター系技術者のための記事と思っ
わーっと書いてみた間違ってたらごめんな Ver.1.0 なにも分からないがとりあえずデータサイエンティストとしての外面だけ取り繕いたい場合 『Rによるデータサイエンス-データ解析の基礎から最新手法まで』 金 明哲著 森北出版 2007年とやや古いですが、機械学習の基本的な手法が網羅されています。本書のRコードをひたすら写経のように実行しましょう。本書とほぼ同内容が著者の金氏のページで公開されていますのでそちらでもよいと思います。 https://www1.doshisha.ac.jp/~mjin/R/ データ分析で用いられる、多変量解析や機械学習などの代表的な手法がほぼ網羅されています。 相談できる人もいない自分が今どのレベルなのかこっそり確認したい場合 データサイエンティストのスキルチェック データサイエンティスト協会が決めたスキル表からランダムに抜き出して簡易チェックができるとのこと。
このページをご覧になる皆さんの中には、統計分析ソフトウェアの R を使った分析には慣れていても、Python を使いこなせていない方は多いのではないでしょうか。 以下の Ajay Ohri 氏のスライド、”Python for R Users” では、R と Python の操作方法の違いを分かりやすくまとめられています。本ページでは、以下スライドの内容を日本語で紹介したいと思います。この内容を理解しておけば、R 経験者にとっては短時間で Python のデータ分析機能を習得できるでしょう。 Python for R Users from Ajay Ohri 基本的なコマンド (パッケージの追加、ディレクトリ操作など) R Python
はじめに バイトでposデータの解析をしなきゃいけなくなり、何も知らなかったので色々あさって、Rで使ったものをメモしたものです。 データサイエンス入門を読んでバイトで使ったものです。 - csvファイル読み込み
RStudioのチーフサイエンティスト、Hadley Wickham(ハドリー)が2月に行った講演のビデオがYouTubeに上がっていたので観た。 "Making Data Analysis Easier"というタイトルでの発表(スライドでは"Managing many models"になっているけど)で、ハドリー自身が考えている、データサイエンスに必要な可視化やモデリングを効率的に行うための手法について、彼の開発してきたパッケージを中心に説明している。 www.youtube.com 分かりやすく、具体例を交えた内容なので、是非YouTubeの動画を観てもらうのが良いと思うが、自分の頭を整理するためにもここでまとめておく。なお、発表スライドはクリエイティブ・コモンズライセンス3.0のもと、表示・非営利のラインセンスで再利用可能となっている。 Hadley Wickham (Chief S
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く