dataminer.me[B!]新着記事・評価 - はてなブックマーク

「あいつ・・・なにやってるの？」データサイエンティストを殺す4つの環境 - dataminer.me

80 users

yanashi.hatenablog.com

はじめにタイトルからすぐに誤解を生みそうなので先にいっておくとデータサイエンティストに対してのネガティブな記事ではありません。自分としてはもっと世の中にデータを生かしてビジネスをより良くしていくことに対して価値を感じてくれる組織が一社でも増えてほしいと思っているし、その際にはデータサイエンティストが不可欠な機能だと思っているのでどうやったらデータやデータサイエンティストを組織で最大限活用できるかということに対する反面教師的な内容だと思ってほしいです。組織におけるデータサイエンティストの立ち位置について「データの分析をタダで引き受けてはならない10の理由」って記事が最近バズっていたけど客観的に見て同じような悩みを抱えている「データサイエンティスト」っていわれる人ってすごく多いんだろうなって思います。最近、ビックデータもしくはデータサイエンティストブームに踊らされて、組織内で「データサイ

テクノロジー
2013/11/02 12:08

データマイニングが苦手なこととDeep Learning（今回はすごくテクノロジーの話） - dataminer.me

8 users

yanashi.hatenablog.com

はじめにいきなり数学っぽいで最近競技データマイニング界（そんな言葉があるかわからないがアルゴリズムの精度を競う大会）「Deep Learning」について調べていて思ったこと。別にDeep Learning自体には触れる気はないのでご興味のある方は以下のスライドを見てみてください：日経ビジネスのDeep Learningの記事 −http://www.ymatsuo.com/papers/DeepLearningNikkei.pdf 一般的なDeep Learning −http://www.slideshare.net/pfi/deep-learning-22350063 ざっくりと何がすごいかというと「汎用的な特徴の集合から複雑な特徴を勝手に解釈してくれる」らしい。そりゃ一般的なサービス開発に向いてるよねと思ったら、しっかりとこのアルゴリズムを作った人の会社はGoogleにすぐに買

テクノロジー
2013/10/21 09:49

『最適化』という魔法の言葉 - dataminer.me

79 users

yanashi.hatenablog.com

はじめにデータマイニングの仕事をやっているとよく『最適化』という言葉に出くわすことがある。例えば、『データマイニングの技術を使って広告効果を最適化してます』とか『うちのゲームはデータ分析によってユーザーに対して最適なコンテンツを出し分けている』とか。自分も困ると『データマイニングにより最適化を行ってます』と話しちゃうことが多い。そりゃ「最適化＝最も適した状態にすること」なんだから話を聞いた相手もぐうの音も出ないから相手を説得しやすい。でも、最適化って「どう最適化するか＝データマイニング技術」よりも「何を最適化するか＝何をKPIにするか」の方がお金儲けに直結するし、そここそがデータマイニングのコアになっていることが多いと思うので、それに関する個人的な意見。例として広告における最適化「CPA最適化」とか「CTR最適化」とか。ネット上でとれる数値に対して最適って言う文脈で出ることが多い

テクノロジー
2013/10/06 06:00

Big data is like teenage sex(ビッグデータは10代のセックスのようなもの) - dataminer.me

45 users

yanashi.hatenablog.com

Big data is like teenage sex 検索で引っかかったどこぞやの大学の人の言葉を引用してみました。 Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone... http://t.co/tREI1mRQ— danariely (@danariely) 2013, 1月 6 ざっくりとした訳は「みんながそれについて話し合うけど、実際それをどうやるか知らない。自分以外のみんながそれをやっていると思っているから、みんながやっているといっている。」って感じ。最近思うこと「ビッグデータ」はアドテクの業界でも「データマネジメントプラットフォーム」とかDSP/RTBとかに関連して話題になっているし、よくお客さ

テクノロジー
2013/09/29 03:40

愛され系データマイニング屋に必要な５個のソフトスキル - dataminer.me

20 users

yanashi.hatenablog.com

前回のエントリーではどちらかというと技術的な区分で今回のエントリーではデータマイナーとして持っていると愛される（＝仕事を湯水の如くふられる）ために必要なソフトスキルについての経験的なメモ。せっかくデータマイナーをやるなら、マネーボールのピーター・ブランド（サーバーメトリックスの人）見たいに愛されながら働きたいですよね、ということでそのために必要だと思ったこと： 1.数字をいくらでも見ていられるスキル膨大なKPIの中からみるべき数字を見つけ出すとか、毎日決まった数字を何個も見続けられるスキル。毎日みているKPIから仮説を構築したり、考察を加えると重宝されます。毎日KPIをみると素早く異変に気づくことができるし、それがあまり得意ではない人も多いので、これをやってあげるとみんなに愛される（見るべきKPIが無限増殖する）人生がスタートします。 2.みんな気づかない数値の関係性が見つけられるスキ

テクノロジー
2012/10/25 19:39

グリーを辞めました - dataminer.me

7 users

yanashi.hatenablog.com

タイトル通り「グリーを辞めました」ということで心機一転、はてなダイヤリーからはてなブログに移行して更新を真剣に再開しようかと。 <以下Facebookに記載した内容から転記> グリーには２年前の４月に新卒として入り、ドリランドの担当・編成の担当・FPのプラットフォームの立て直し、SP版プラットフォームの立ち上げから改善、そしてグローバル版プラットフォームの立ち上げ・・・新卒からで３年も働いていない人にも関わらず多くのチャンスを与えていただきました。送別会も取締役や部長陣の方々を含む総勢１００名以上の人がきてくださり、DJプレイ・ハマーのリムジンでのツアーやシャンパンタワーにシャワー・卒業ムービーなど今までのグリーの卒業式ではない盛りだくさんのイベントを楽しませていただきました。これは中心となって卒業を祝ってくれた面々を中心としたグリーで関わった皆さんに支えられてのことだと思っております

テクノロジー
2012/10/23 11:00

退職
GREE

データマイニングを仕事にする人の生態系 - dataminer.me

353 users

yanashi.hatenablog.com

「データマイニングを仕事とする人＝データマイナー」はどういう人たちがいるかということについてビックデータとかで世の中がバズってるけど「僕はデータマイニングをやってます！」といったときに適切にその人がやっている業務領域を把握している人ってかなり少ないと思う。グリーで働いていたときもデータマイナーはどういった仕事をしていて、何をやっていて何ができるのかっていうことを理解していなくてミスコミュニケーションが生まれていたと思うのでちょっとその生態系についてまとめてみた。おそらく、データマイナーといわれる人は以下のタイプがいる：研究開発をする人統計学的に新しいイノベーションを起こせる人。Google のPageRankアルゴリズムを作りましたとか、NetfrixやAmazonのレコメンデーションエンジン作りましたとかいう人がこれにあたる。スキル的には統計学にかなり長けている必要があり、その他

テクノロジー
2012/10/22 21:48

dataminer.me

6 users

yanashi.hatenablog.com

はじめに全然データマイニングとは関係ないけど昔から思っていること。特に今日じげんが上場した今日だから考えをまとめてみようと思います。平尾くんはものすごく尊敬しているし、昔から人として憧れているし、今でも自分の身近に居てどの起業家よりも憧れている起業家です。実は医学部を受験してたんですが、そんな中で唯一慶応のSFCを受験した理由は平尾くんの影響がとっても大きいです。って思う中で、自分の中で人が成功する中で一番重要な能力である「勝負強い」という能力について自分なりにまとめてみようと思いました。じげんの平尾社長、新規公開株が過熱「いいタイミングで上場できた」 http://t.co/l6zPsEMKcH— 日経電子版マーケット (@nikkei_market) 2013, 11月 22 どうしてそう思うかというと平尾くんにあった人は”平尾くん”と彼を呼ぶことに違和感があると思います。って

テクノロジー
2010/03/08 09:16

統計
blog

RSCTC2010＋そのとき使った解析のフロー - dataminer.me

8 users

yanashi.hatenablog.com

RSCTC2010というのに統計解析のコンテストに出場して（一応）世界で９６人中３位になりました。 → http://tunedit.org/challenge/RSCTC-2010-B?m=leaderboard このコンテストが何をやるコンテストだったかというと DNAマイクロアレイのクラスタリングのコンテストで、2クラスから5クラスの分類を 6課題くらい行うというものでした。テストデータの段階では、微妙に19位くらいで恥ずかしかったので周りにいわずにたらたらやってました。なので、ほとんど期待していなかったのですが本番のデータでやってみたところ精度が3位になっててちょっとびっくり。（しかも、超僅差で3000USDもらい損ねた。。。）ただ、使ったアルゴリズムはむちゃくちゃ単純なので解析のフローについて若干以下に書いておきます。利用したのは・ランダムフォレスト

テクノロジー
2010/03/07 15:56

R+Pythonでマルコフ連鎖モンテカルロ - dataminer.me

4 users

yanashi.hatenablog.com

バイト先で広告の効果測定を頼まれたので、前々から興味があったMCMCを使って測定を行った。 PythonにはPyMCという専用のパッケージがあるけど、そっちはどうも小難しい感じがしたので Rpyを使って使えるようにしてみた。使い方はRで回帰分析をするときとほとんど同じでデータフレームと数式を入れると結果を出すという形式にした。用いたデータは２００４年1月〜２００９年9月までの円ドルレートとアメリカの失業率。（http://www.mediafire.com/?mfo5mmezow3） MCMCで解析した結果とその際に行われた推定の過程をPDFファイルで吐き出してくれるようにした。解析した結果はと言うと、失業率と円/ドルはそこまで関係が強くないらしい（回帰分析でR2が0.63くらい）単変量であたるくらい単純なものだったら、FXで損する人はいないか。以下、今回用いたソースコード。 #

テクノロジー
2009/11/07 08:00

レコメンデーションコンテスト２００９の感想 - dataminer.me

3 users

yanashi.hatenablog.com

主に精度部門に関して。ビジネス部門に出ている人間の戯言なので、参考にならないかもしれないが。どうも、上位の人たちと下位の人たちの知識レベルにあまりに差があると思ったので自分が”精度を高める”と言うことだけにエンジンを作るとしたらということをメモってみました。参考にする方がいらっしゃったらどうぞ。参考資料 ※　ネットフリックスのレコメンドエンジンコンテスト http://www.netflixprize.com/ ※　そのコンテストで賞金獲得の決め手となった、と言われているアルゴリズム http://research.yahoo.com/pub/2824 ※　Githubコンテストの上位者の論文 http://www.computer.org/portal/web/csdl/doi/10.1109/WI-IAT.2009.78 1.前処理前処理として、必要なものは2点。・行列

テクノロジー
2009/10/28 16:07

はてなブックマーク

はてなブックマーク

『dataminer.me』

勝負強いという”能力”について（じげんの上場で思ったこと） - dataminer.me

「あいつ・・・なにやってるの？」データサイエンティストを殺す4つの環境 - dataminer.me

データマイニングが苦手なこととDeep Learning（今回はすごくテクノロジーの話） - dataminer.me

『最適化』という魔法の言葉 - dataminer.me

Big data is like teenage sex(ビッグデータは10代のセックスのようなもの) - dataminer.me

ソーシャルメディア×データ分析で見る衆議院選挙の動向 - dataminer.me

愛され系データマイニング屋に必要な５個のソフトスキル - dataminer.me

グリーを辞めました - dataminer.me

データマイニングを仕事にする人の生態系 - dataminer.me

dataminer.me

RSCTC2010＋そのとき使った解析のフロー - dataminer.me

R+Pythonでマルコフ連鎖モンテカルロ - dataminer.me

レコメンデーションコンテスト２００９の感想 - dataminer.me

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

『dataminer.me』

このページはまだブックマークされていません

キーボードショートカット一覧

公式Twitter

はてなのサービス

このページはまだ
ブックマークされていません