タグ

datascientistに関するmuddydixonのブックマーク (35)

  • データサイエンティストに王道無し - 渋谷駅前で働くデータサイエンティストのブログ

    TL;DR(思ったよりもかなりの長文になってしまったので*1、時間がないという方は1番目と2番目のセクションの冒頭だけお読みください) しんゆうさんの舌鋒鋭いブログ&note記事にはいつも楽しませていただいているのですが、この記事は一点僕のデータ分析業界の認識に新たな視点を与える話題があって特に目を引きました。それが以下の箇所です。 資格があるわけでもないので名乗るのは自由だし、未経験だろうが文系だろうがそれはどうでもいいのだけど、傍から見ていると「サイエンティスト」と名乗っているわりには「サイエンス」な話をしていないなぁとは思っている。(中略) 現在起きている第3次データサイエンティストブームは「データサイエンティストと名乗りたい人」が盛り上げているように見える。 (太字筆者) この問題は、このブログの前々回の記事でも取り上げています。 ただ、僕はこういう「データサイエンティストになりた

    データサイエンティストに王道無し - 渋谷駅前で働くデータサイエンティストのブログ
    muddydixon
    muddydixon 2020/07/28
    注釈めっちゃあるw
  • 全くのゼロから「駆け出しデータサイエンティスト」を育てる方法論 - 渋谷駅前で働くデータサイエンティストのブログ

    (Image by Pixabay) 「データサイエンティスト」の第一次ブーム勃興から6年余り、人工知能ブームに便乗した第二次ブームで人口に膾炙してから3年余り、気が付いたら何やかんや言われながらもデータサイエンティスト及びその類似職が、じわじわと日国内の産業各分野・企業各社に広まりつつあるように僕の目には映ります。 そういう背景がある中で、ここ1年ぐらいの間にそこかしこで目立つようになってきたのが「ゼロからデータサイエンティストを育てたいのだがどうしたら良いか」という相談や議論。割とあるあるなのが「取引先がデータサイエンティストを採用して商談の席に同席させるようになって、彼らがデータサイエンスの知識を駆使してビシバシ突っ込んでくるのだが、こちらにデータサイエンティストがいないので対応できない」みたいなお話。これは実はUSでも同様だと聞くので*1、案外洋の東西を問わない課題なのかもしれま

    全くのゼロから「駆け出しデータサイエンティスト」を育てる方法論 - 渋谷駅前で働くデータサイエンティストのブログ
  • 研究者を辞めた時のこと、そしてその後のこと - 渋谷駅前で働くデータサイエンティストのブログ

    TL;DR これは、このブログの題とは何の関係もない僕自身の回顧録にして懺悔録であり、見ようによっては怪文書です*1。故に、記事中には何の参考になる内容も書かれていないことを予めお断りしておきます。それでも良いという方だけ、この先をお読みください。ただしTL;DRと書いた通りで、超長文につきご注意を。 当時から7年が経ち、この中に登場する人物の中には既にリタイアしている人もいれば、物故している人もいます。ある意味もう時効だろうということで、その時起きたことをつぶさに書いてみることにした次第です。 研究者を辞めた時のこと 研究者の道を目指した理由 正直言って無能だったが、勉強だけは熱心なポスドクだった ポスドク待遇改善運動、研究体制改革運動を経て、業界では知らぬ者のないお尋ね者になった そしてポスドクをクビになり、国内に行き先がなくなった 土壇場でシンガポールでのjob talkに招かれた

    研究者を辞めた時のこと、そしてその後のこと - 渋谷駅前で働くデータサイエンティストのブログ
  • HUNTER×HUNTERの念能力6系統で喩えるデータ分析スキル - 六本木で働くデータサイエンティストのブログ

    HUNTER×HUNTER モノクロ版 36 (ジャンプコミックスDIGITAL) 作者: 冨樫義博出版社/メーカー: 集英社発売日: 2018/10/04メディア: Kindle版この商品を含むブログを見る みんな大好きHUNTER×HUNTERの36巻発売を記念して、調子に乗って面白いことを考えてみました。。。と言いますか、正確には某所で提案をいただいたのでやってみることにしました。題して「念能力6系統で喩えるデータ分析スキル」です。一見バカバカしい感じもしますが、念能力6系統のように「それぞれに独立した軸として定義可能でしかも互いの親和性も表すことができる」という点で、なおかつHUNTER×HUNTERファンであれば容易にその位置付けが理解できるという点で、データ分析スキル同士の関連性をある程度分かりやすく表せるのではないかなと思ったのでした。 スキルセットの一覧については、以前のス

    HUNTER×HUNTERの念能力6系統で喩えるデータ分析スキル - 六本木で働くデータサイエンティストのブログ
  • データサイエンティストが働いて嫌だったなと思う人たち

    コンサルにてアナリストをやった後、データサイエンティストを名乗りながら仕事をしています。そんな中で嫌だったなと思った人たちとプロジェクト 1.医療統計の周りの人 最近はアウトカムでの評価の流れにはなってきたが、まだまだモデルの評価をする事は少ない。 でも何故か相変わらずロジステックとCox回帰をやれればおっけーであり、モデルの精度が当たらなくてもオッズ比と説明変数の 有意差だけでていれば上手く行く分野。 当に心が痛む上、まだまだ「医者でなければ人であらず」が通ってしまい、モデルの説明よりもお医者様のお言葉が1stにきてしまう。また分析プロジェクトの 設計らしい設計があまり出来ないのもつらいところ(モデルの精度が出ていないのにそのオッズ比・有意差に何の意味があるんだと思う)。後日の製薬企業から「何とか工夫で有意差がでないのか!!」 という謎おしかりを受ける・・・いやそんなん無理ですやんと

    データサイエンティストが働いて嫌だったなと思う人たち
  • データサイエンティストや機械学習エンジニアに求められる「素質」とは何か - 渋谷駅前で働くデータサイエンティストのブログ

    (Image by Pixabay) 某所で時々意見交換させていただいている@maskedanlさんが、面白い記事をnoteにupなさっていたので拝読しました。細かい内容は上記のリンク先から皆さんに直接お読みいただくとして、記事中で某所で僕が放言(笑)したことへのご質問をいただいていたのでした。それは、データサイエンティストや機械学習エンジニアといったデータ分析人材に求められる「素質」について、です。 それは例えば統計学や機械学習はたまたプログラミングといった「スキル」や「素養」とも違う、言ってみれば性格的傾向とか仕事スタイルとかはたまた思想信条のような、もうちょっと属人的で曖昧なものだと思うのですが、個人的な経験からはその「素質」の有無がデータ分析職として育成した結果、ものになるかならないかを分けるように感じられています。 ということで、あくまでも個人的経験に基づく範囲でデータサイエンテ

    データサイエンティストや機械学習エンジニアに求められる「素質」とは何か - 渋谷駅前で働くデータサイエンティストのブログ
  • 事業会社のデータサイエンティスト 会社を退職しました

    元々コンサル会社から事業会社のほうでデータサイエンティストをやるようになって1年経つが辞める。そのきつかったことを匿名という場所で卑怯ながらも話したいと思う。 元々私は大学院でそこそこ統計をやってきてから、コンサル会社に行きデータサイエンティストとして事業会社へ移った口だ。 根的にデータサイエンティストとしての資質としてざっくりいうと以下の3つが必要だと思われる。 1. 統計能力関係及びそのプログラミングや可視化能力 2. KPI設計及び事業からのKPIへの落とし込みからそのKPIからどう事業繋がるかというビジネス設計能力 3. 上を基にしたコンサル能力 私能力的には1がやや強く、その次に2がまぁまぁそして3はまだまだといった所で事業会社でデータサイエンティストとして孤軍奮闘をすることになった。 入社理由データはあるが、なかなか活用できていないこともあり、分析から企画から関われるという事

    事業会社のデータサイエンティスト 会社を退職しました
    muddydixon
    muddydixon 2018/02/23
    HAROiD 入社初日から視聴ログを眺めて Redash に保存して Jupyter (Python2/3、R、Julia)でワイワイできるからお待ちしております https://www.green-japan.com/job/58805
  • データサイエンティストサミット 2014に参加してきた | DevelopersIO

    データ分析・活用から、成長と収益を生み出す!気鋭のデータサイエンティストが大集合!:データサイエンティストサミット 去年2013年12月に開催された第1回からおよそ7ヶ月。早くも今年度のイベントとして開催告知されていたので申込み。2014/06/27(金)に参加して来ました。 データサイエンティストサミット 2013に参加してきた | Developers.IO 開催場所は秋葉原コンベンションホール - AKIHABARA Covention Hall@秋葉原。弊社オフィスも秋葉原で、会場も駅を挟んですぐという事でアクセスもあっという間でした。駅からすぐ近くの建物というのも嬉しいですね。 こちらは会場入口。例によって会場内は写真撮影禁止のようでしたので、ここからは文字と引用画像や動画等を踏まえてセッション内容をレポートして行きたいと思います。では開店! 目次 10:00 - 12:30【S

    データサイエンティストサミット 2014に参加してきた | DevelopersIO
  • 面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!

    転職して丁度2年がたちました。 現在はWebベンチャーで統計屋しています。大変楽しい毎日です。 なぜ楽しいかというと勿論リスプを書いているからというのも大きなる理由の一つです*1。 このエントリでは何が楽しいのか近況交えてつらつらまとまりなく書いてます。 あと現職の解決しがたい不満についても書いています。 糞長くなってしまったので要約すると 「今糞面白いけど超えられない壁あるので誰か助けて」 です。 現職面白い理由5個。 1.データが面白い*2 私は経済学科・数理統計の研究室出身で、応用先としてコミュニケーション活性化を目的とした 行動経済学やテキストマイニングをやっていました。 そういう背景があるため、学生時代いつか壮大な社会実験をやりたいと思ってたけど、 それには大変なお金がかかったり大がかりなシステムを構築しないといけなかったりで断念した。 ですが今はSNSやソーシャルゲームや広告の

    面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!
    muddydixon
    muddydixon 2013/12/03
    意識高まった1!
  • 5年後のデータサイエンティスト

    2. お前誰よ ところてん – http://twitter.com/tokoroten 大学時代 – – – – – 電子透かしの研究(B2~B4) コンシューマゲーム会社で9ヶ月のインターン(B3) 自然言語処理を利用したPhishing対策(B5~M2) 半導体計測器開発ベンチャーでバイト、C++と光学設計(B4~M2) IPA未踏ユース(M1)、学生ベンチャー起業(M2) 社会人 – 某通信会社の研究所(3年弱) – コンピュータウィルスの収集、分析 – クラウド、ビッグデータ関連の研究 – ドリコム(2年目) – インフラ → プロモーション分析 → アプリ分析 – 現在はソーシャルゲームデータ分析 兼 企画含めた何でも屋 Copyright Drecom Co., Ltd All Rights Reserved.

    5年後のデータサイエンティスト
    muddydixon
    muddydixon 2013/11/28
    しれっとプッチが出てきて鼻水吹いたw 良スライドでした!
  • データサイエンティストに必要な3つのスキル | quipped

    久しぶりにタイトルで釣りにいっているが、ブラウザの「戻る」ボタンを押さないでくれw ... ... ... (よし、まだ「戻る」ボタンを押してない!) ぼく自身、データサイエンティストだったことはないが、一応大学では数学を勉強していたし、金融でクオンツトレーダーもやっていたし、人生3回分(と言ったら言い過ぎか)くらいのSQLクエリは書いている。なので、これから書くことは、屋に立ち並ぶ歯の浮く様なビッグデータ談義よりは、普遍的な価値があると自負できる。 もう一つ題に移る前に、「データサイエンティスト」という呼称について感じる両価的な感情について軽く説明したい。 ぼくは幸いにも優秀な同僚や友人に恵まれていて、彼らの中には、データ分析屋さんでありながら、データを集めてきて(広義の)データウェアハウスに突っ込むという非常に面倒くさい一連の作業もちゃっちゃか出来る奴が2、3人いる。そういうマルチ

    muddydixon
    muddydixon 2013/11/19
    「3ー4%売り上げが改善できれば良い方だった」昔、レコメンドシステムを作った時に(いろいろと恵まれ)高いCTRを出したことがあったけど、PVが小さいためその結果が無視されたことがあったりしたなぁ
  • 「あいつ・・・なにやってるの?」データサイエンティストを殺す4つの環境 - dataminer.me

    はじめに タイトルからすぐに誤解を生みそうなので先にいっておくとデータサイエンティストに対してのネガティブな記事ではありません。自分としてはもっと世の中にデータを生かしてビジネスをより良くしていくことに対して価値を感じてくれる組織が一社でも増えてほしいと思っているし、その際にはデータサイエンティストが不可欠な機能だと思っているのでどうやったらデータやデータサイエンティストを組織で最大限活用できるかということに対する反面教師的な内容だと思ってほしいです。 組織におけるデータサイエンティストの立ち位置について 「データの分析をタダで引き受けてはならない10の理由」って記事が最近バズっていたけど客観的に見て同じような悩みを抱えている「データサイエンティスト」っていわれる人ってすごく多いんだろうなって思います。最近、ビックデータもしくはデータサイエンティストブームに踊らされて、組織内で「データサイ

    「あいつ・・・なにやってるの?」データサイエンティストを殺す4つの環境 - dataminer.me
    muddydixon
    muddydixon 2013/11/07
    僕が感じていたことを全部書いてくれてる
  • 【インタビュー】ヤフーが日々蓄積するビッグデータの塊、3500台のHadoopで処理し地道に活用 

    muddydixon
    muddydixon 2013/09/17
    260名か・・・
  • 最新業界事情から見るデータサイエンティストの「実像」

    PDFでupし直しました。 Webマーケティング・リレーセミナー 15 http://www.cb21.co.jp/seminar_events/relayseminar/15.html でお話した内容です。ただしオフレコで質疑でぶっちゃけた話の方が面白かったかもしれません(笑)が、それは会場参加者の皆さまだけの特典ということで。Read less

    最新業界事情から見るデータサイエンティストの「実像」
  • さらば!データサイエンティスト

    2. 自己紹介  比戸将平(HIDO Shohei)  TwitterID: @sla  専門:データマイニング、機械学習  経歴:  2006-2012: IBM東京基礎研究所データ解析グループ  機械学習(特に異常検知)のアルゴリズム研究開発  お客様案件でデータ解析プロジェクトに従事  2012-: 株式会社プリファードインフラストラクチャー  大規模オンライン分散機械学習基盤Jubatusチームリーダー  2013-: Preferred Infrastructure America, Inc.  Chief Research Officer 2

    さらば!データサイエンティスト
    muddydixon
    muddydixon 2013/08/23
    「うおおおおおお」みたら十分
  • データサイエンティストが要らなくなる日が来るかもしれない | IT Leaders

    大手ITベンダーの研究所でビッグデータ活用に携わった経験を生かし、データサイエンティストに関する情報を発信する株式会社プリファードインフラストラクチャーの比戸将平氏に話を聞いた。 ―前職のIBM東京基礎研究所でデータ解析関連のプロジェクトを担当された経験を活かし、データサイエンティストに関する講演をされています。データ分析の現場を生々しく描かれていますね。 昨年ごろから、データサイエンティストという言葉を耳にする機会が増えました。興味を持って調べてみたところ、かつて私が担当していた業務そのものでした。当時、私は機械学習やデータマイニングを使って、顧客をセグメンテーションしたり、機械が壊れる前に兆候を検知したりする仕組みを構築していました。それならば、データサイエンティストと呼ばれる人材の実態や、悩みどころをシェアできるのではないかと考えたのです。 昨今、データサイエンティストには、期待が集

    muddydixon
    muddydixon 2013/08/01
    この記事、不思議な感じ・・・ sla さんの資料を噛み砕いて感想を述べる記事?disではない
  • DeNAを退職しました - yokkunsの日記

    2011年5月に入社して、2年間ほど勤めたDeNAを日(6/30)付けで退職しました。 DeNAでの2年間は、2年間とは思えない程濃い時間で、当に様々な経験をする事が出来ました。 入社して最初は、データマイニング部という部署に配属され、他部門で解決出来ないような難易度の高い課題に対して、各種方法論を使って解を出すといった事をやっていました。 まだデータが整備されていない状態の中で、求められているスピード感&クオリティが高く、中々苦労したのを覚えています。 基的な統計モデルの適用だったり、他の業界で使われているような応用的な手法の適用、あるいは新しいモデルを作ったりなど、かなりチャレンジングな事をさせてもらいました。 データマイニング部の時に作ったモデルの一つに、TVCMの効果測定モデルがあったのですが、そのモデルを運用してもっと深い分析をしたいというお話があり、出向という形でマーケテ

    DeNAを退職しました - yokkunsの日記
  • サイバーエージェントを退職しました - 渋谷駅前で働くデータサイエンティストのブログ

    私事ですが、日をもって株式会社サイバーエージェント退職しました。 正式には6月30日が退職日なのですが、日が最終出社日*1なのでサイバーの同僚の皆さんと(同僚として)お会いするのはこれで最後です。 思えば、アカデミックなキャリアから民間企業キャリアに転じようと決心し、昨年の6月1日にサイバーに入社して以来、当に色々なことがありました。 そもそも実はその正式な入社日以前から、12新卒エンジニアたちに混じってJava研修を受けさせてもらったり、その12新卒の彼らから物凄いカルチャーショックを受けたり(笑)*2、よくよく考えたらアカデミアでは一番の若手だったのにサイバーでは最年長レベルだと気付いて萎えたり*3、正式入社の直後にビッグサプライズがあったり*4、右も左もわからないうちに渋谷ラボ(当時)の室長を任されたり*5、突然外国人が半数以上の技術委員会の委員を引き受けることになったり*6

    サイバーエージェントを退職しました - 渋谷駅前で働くデータサイエンティストのブログ
  • 「施策を打ったらKPIが上がった!」だけで満足するのは危険 - 渋谷駅前で働くデータサイエンティストのブログ

    ソーシャル(特にソシャゲ)界隈の業界では未だによく聞こえてくる話が、 「毎日毎週施策を打つたびにしっかりKPIが上がってるのは見えてるのに、半年後とかの数字見るとなーんか芳しくないんだよね。何でだろう?」 という不思議な愚痴。このブログを初期の頃から読んでいる人なら知っての通り、それを聞くなり「平均への回帰」とか「見せかけの回帰」とかにやられてるよなー、と僕なんかは思うわけですが。最近またそういう話を業界内で見聞きする機会が増えてきたので、改めてまとめてみます。 何でこうなってしまうのか? ここでは一つありがちなパターンを見てみましょう。例えばDAUか何かのKPIを想像してみます。施策をA, B, Cと3種類ぐらい持っていて、コストや工数を考えながら投入していく感じです。 施策A1、施策A2を打てばそれなりにDAUが上がって、ここで有効期間の長い施策B1を打ってみたら右肩上がりに上がった!

    「施策を打ったらKPIが上がった!」だけで満足するのは危険 - 渋谷駅前で働くデータサイエンティストのブログ
  • 自分が感動した人生、NLP、機械学習に関連したプレゼンテーションとブログ記事 - Topics Related to Computers and NLP

    自分の一年と少しという短い研究期間で最も気に入っているプレゼンテーションやブログ記事を何点か挙げる。 全部技術的な発表や記事ではなく、自分の心に深い部分に何かを語りかけたモノを挙げていく。 1.パターン認識と機械学習入門 パターン認識と機械学習入門 タイトルからして「うわ、、数式一杯やだな」と思うかもしれないが、これは人が人生を送るうえでやっていることを、機械学習の世界に絡めたプレゼンテーションである。数式は一切ない。 自分が特に気に入っているのは「みにくいアヒルの子定理」の直観的解説の部分。これは「人は自分の価値基準(=事前知識orコスト関数と自分は解釈)を用いないと、最適かどうかを判断できなくなる」と自分は解釈している。あなたが人生で何を大切にするのか?を考えないと、現実でも機械学習の世界でも何も判断できないよ、というメッセージが自分の心に刻み込まれた。 2013年6月15日追記: 上

    自分が感動した人生、NLP、機械学習に関連したプレゼンテーションとブログ記事 - Topics Related to Computers and NLP