August 30, 2014 第42回R勉強会@東京(#TokyoR)で「R入門(dplyrでデータ加工)」を発表しました
August 30, 2014 第42回R勉強会@東京(#TokyoR)で「R入門(dplyrでデータ加工)」を発表しました
遂にid:TJOさんの『手を動かしながら学ぶ ビジネスに活かすデータマイニング』が発売されました。 子供の頃に、FFやドラクエが発売されるのを楽しみにしていたような気分で発売を待っていました! 手を動かしながら学ぶ ビジネスに活かすデータマイニング 作者: 尾崎隆出版社/メーカー: 技術評論社発売日: 2014/08/22メディア: 単行本(ソフトカバー)この商品を含むブログ (1件) を見る 厳密な数式うんぬんより、"イメージ"を大切にされているのが伝わってくる本ですね^^ 今週末は出先で時間を見つけつつ、掲載コードを打っています。 さて、p.182 図9-7を描画しようとしたところ、コードが載っていないことに気づきました。図9-6では閾値を設けておらず、ごちゃごちゃしているため、support>=0.3で描画するエッジを限定しましょうという箇所です。 そこで簡単ではありますが、勝手にコ
「手を動かしながら学ぶ ビジネスに活かすデータマイニング」を献本頂きました! @TJO_datasci さん、ありがとうございます! まだパッとみた感じではあるのですが、本書の内容としては、 各統計手法の解説を中心にビジネス応用する部分の入り口までうまく書かれています。 従来、統計手法の解説は、数式と言葉が中心でしたが、 この本では、概念図とコードとその結果という説明方法でとても分かりやすく書かれています。 著者のブログでも書かれているように、 まさに『統計学も機械学習も「直感的にわかる」』本になっているので、特に初心者の方におすすめです! 興味のある方は、ぜひ書店でお手に取ってみてください! 関連 『手を動かしながら学ぶ ビジネスに活かすデータマイニング』(技術評論社)を書くに当たって気を付けたこと&補足など(追記あり) - 六本木で働くデータサイエンティストのブログ http://tu
著者の方から「戦略的データマイニング」という本をいただきました!ありがとうございます! という記事を先日書きました。 2014-08-22 - 盆栽日記 せっかくなのでネチネチあら探しをします。慈悲はない。 なお、あくまで初版についてのあら探しであることにご注意ください。 plyrパッケージが前提である記述がある mapvalues関数、revalue関数、round_any関数はいずれもplyrパッケージの関数です。 また、reshape2パッケージのくだりで使われている.関数(ドット関数)もplyrパッケージの関数です。 P17の掲載コードでは突然plyrパッケージが読み込まれていてなんで???みたいな気持ちになりますがそういうことです。 plyrパッケージを読み込んでないと関数 "."がないとか怒られます。 n-distinct関数など無い 4章で多用されているdplyrのn_dis
最近、本書いたエントリーしか書いてないんじゃないかと噂ですが、 今回も本書いたエントリーです!(笑) 前回の報告のときにも触れましたが、戦略的データマイニング (シリーズ Useful R 4) という本を執筆しました! (ちなみに、初の単著です!) この本は、自分のこれまでの経験をもとに構成していて、 例えば、エンジニアからデータ分析者になったときに感じたギャップや、 エンジニアの時には意識する事もなかったマーケティング戦略的な視点などを整理してみた本になっています。 整理する際には、いろんな切り口があると思いますが、 この本では、以下の三つの切り口で整理しています。 解決すべビジネス課題を見つける 何をすべきかの意思決定を支援する アクションを自動化するためのロジックを作る また、なるべく初心者向けにしたいなという思いがあったため、 この手の本では珍しく、数式を使わない方針で書いていま
ここ数年、私はデータサイエンスについて学んでいます。おすすめの学習資料を紹介したいと思います。 教師用の教科書と初心者用の教科書 私自身、データサイエンスを学ぼうとして色々なソースを試してみました。残念なことに、日本語の良い学習資料は見つけられませんでした。どこかのブログで読んだことがありますが、教科書は教師用と学生用の二週類があるそうです。一つめは内容が既に分かっている教師の為の教科書で、日本はこのタイプです。もう一つのタイプの教科書は自学自習を目的に作られているので、教師なしで学ぶできる教科書になっているということで、アメリカはこのタイプの教科書が多いです。私自身、他の文系・理系の教科書を探した時もアメリカの教科書の方が分かりやすく、その本だけを読めば分かるようになっていると同じ印象を持ちました。 オンライン教育(MOOC) アメリカは科学教育に熱心であり、最近はやりのMOOCでも豊富
最近、データ分析に興味があるので、「ビジネス活用事例で学ぶデータサイエンス入門」を読んでみた。 ビジネス活用事例で学ぶ データサイエンス入門 作者: 酒巻隆治,里洋平出版社/メーカー: SBクリエイティブ発売日: 2014/06/25メディア: 単行本この商品を含むブログ (1件) を見る 1章でデータ分析について簡単に説明して、2章で以下のデータ分析のフローを紹介、 1. 現状とあるべき姿 2. 問題発見 3. データの収集と加工 4. データ分析 5. アクション それ以降はこのフローに則って、3~6章に基礎的な内容、7~10章に応用的な内容が書かれている。 内容としては、ソーシャルゲーム会社のゲームアプリの諸問題を改善するのにデータ分析を利用するというシナリオになっていて、具体例をあげながら、フローに沿って説明されるのでわかりやすい。 書面の都合上、2の問題発見の部分が結構さらっと書
「データ解析のための統計モデリング入門」の著者の久保拓弥氏へのお返事なのですが、別所の「統計モデルに観測値と観測値の割り算値を入れても問題ない」に対して以下のようなコメントをもらったので、具体的な例を作ってみました*1。 …まあ,みなさん割算値だい好きだし,これからも割算値いりの統計モデルが使われるのでしょう.とりあえず「この場合は明らかにかなりまずいでしょ」とわかる例を何か作ってみようかな… 誤差項がコーシー分布のようなものになったときに、どのぐらいバイアスがかかるのかに関して、直観的な話です。 1. 真のモデルに割り算が無いケースを考える 以下のようなx、y、zの関係を現す真のモデルを考えます。 「観測値は非確率変数で、未知の何かが誤差項を作っている」と仮定すると終了するので、xの観測値x'はxと正規分布に従う観測誤差、yの観測値y'はと正規分布に従う観測誤差の合算とします。後のシミュ
head -c 100 /dev/urandom | LC_ALL=C tr -dc 'A-Za-z0-9_!@#$%^&*()\-+=' head -c 100 /dev/urandomは、urandomから100(単位は知らない)だけcat。trは文字列を置換。 headの100を増やしたり減らしたりすると長さ変えられる。文字列に使う文字はtrに渡すやつ変える。 参考 random - Why can't tr read from /dev/urandom on OSX? - Unix & Linux Stack Exchange コマンドラインでランダムな文字列を生成する - ぱせらんメモ
2014/7/26 "第38回 データマイニング+WEB@東京( #TokyoWebmining 38th ) −マーケティング分析活用最前線 祭り−"を開催しました。 第38回 データマイニング+WEB@東京( #TokyoWebmining 38th ) −マーケティング分析活用最前線 祭り−: Eventbrite Google グループ 会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。 参加者ID・バックグラウンド一覧 参加者Twitter List : tokyowebmining-38 参加者セキココ:第38回 データマイニング+WEB @東京 セキココ (作成してくれた [Twitter:@komiya_atsushi
data.tableのfreadは読み込みがめちゃ速いがzipをそのまま読み込んでくれない。 > fread("C:/Users/hoge/iris.zip") Error in fread("C:/Users/h1030/iris.zip") : embedded nul in string: '$Qcーゥエネ?e轄I7!H\036ヲ+1ォ:粐*=\026\035mス岻Iンキ弌GS?T)レ\xe4\001ェR倉6\006絛*>イ?リ耘ァ\020�啗テ\031\0038軋M6Vォ\xec\017モ]H\xfa(ネイ\036軍!玉トミエ\037カW)J&ヨGUオ\x87+1\003ン�佻ユ列W、条De\033レ1\xecw薤\036\030戎ワj\020\xfeクt\021e=ミHクC\x85Fュ\x86zヤ\027\xeaツom\xeb」h\xfb\022恨ヘ」
7月30日の正式サービスを控え、現在事前登録アプリが配信中のオンラインRPG『ドラゴンダイス』。ファミ通App編集部では、本作の最新PVを一般公開に先駆けて先行公開! PVはダンジョン編とボスバトル編の2種類があり、それぞれの特徴が分かる内容になっている。 本作のダンジョンに登場するキャラクターは、すべて実際のプレイヤー。ダンジョンはサイコロを振って移動。ひとつのダンジョンに最大20人が参加でき、他プレイヤーと協力しながらトラップを解除して、ボスが待ち受ける扉を目指すことになる。 トラップの解除に不可欠なのが、仲間とのチャット。特定のマスに乗ると、別の場所の扉が開いたり、石版に書かれた暗号を共有したりなど、ダンジョンを攻略する上で仲間の協力は欠かせないのだ。点在する宝箱はプレイヤーごとに分かれているので、奪い合いにならないのもうれしいところ。ちなみに、動画の最後に映っていたのが、事前登録ア
This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.
ビッグデータ時代とも言われる昨今においては、膨大なデータをビジネスの枠組みの中に組み込んで活用することが重要課題となっています。つまり、データ収集を行ってビジネスの全体像を把握し、適切なデータ分析を行って正確な予測をした上でビジネス戦略を決めることが求められています。本書は、データをビジネスに活かすために身に付けておくべき基本的な考え方と、データマイニングやモデリングの根底に存在するコンセプトについて、体系的に解説しています。データサイエンスの重要性とその威力を学べる一冊です。 訳者前書き はじめに 1章 はじめに:データ分析思考 1.1 データを使ったビジネスチャンスの広がり 1.2 例:ハリケーン・フランシス 1.3 例:顧客の乗り換えの予測 1.4 データサイエンス、エンジニアリング、そしてデータ主導による意思決定 1.5 データ処理とビッグデータ 1.6 ビッグデータ1.0からビッ
データ分析から導き出されたインサイト無しにAI(人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって本当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ
Apple は、リワード付き広告の取り締まりから手を引いたようだ。 先週、Appleが動画を見せてゲーム内通貨を与えたり、ツイートなどでゲームプレイに必要なスタミナを与えるアプリをリジェクト(審査落ち)させて話題になったが、TechCrunchの記事によると、Apple は動画の視聴や、Twitter などでの共有を理由にアプリをリジェクトしなくなったという。 実際、ゲームキャストにもリワード広告付きアプリが審査にとおったという話が数件寄せられている。 例えば、先週末に日本で出た『サッカーアルティメイタム』には動画のリワード広告がついている。 これによって、「アプリをDLすると○○が手に入る!」系の機能も復活することだろう。 Appleが審査基準を緩めた背景は分からないが、あえて推測するのであれば「やってみたら反発が大きすぎた」というのがあるのかもしれない。 『Tinytower』のNim
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く