タグ

2013年11月3日のブックマーク (2件)

  • Building Data Products

    Josh Wills shares how to be successful building data products and explains what a Data Scientist is at the Federal Big Data Forum.Read less

    Building Data Products
    shiumachi
    shiumachi 2013/11/03
    Clouderaのデータサイエンティスト(DS) Josh Willsによるプレゼン。スライド4-6に、「自分の考えるDS」「多くの人の考えるDS」「自分が実際にやっている仕事」のスライドがある。画像だけだが、全てを物語っている
  • Hadoop/Storm の統合を実現する Twitter の SummingBird - Okapies' Archive

    Twitter が SummingBird を正式リリースして早二ヶ月。「日語の紹介記事がほとんど出てないな」と気付いたので、調査がてらまとめてみました。 SummingBird とは? MapReduce なプログラムを書くための Scala/Java ライブラリ。最大の特徴は、ひとたび SummingBird で書いたジョブは Hadoop でも Storm でも同じように実行できること。 SummingBird では、Hadoop を使う「バッチモード」と、Storm を使う「リアルタイムモード」に加えて、二つを同時に実行する「ハイブリッドモード」がある。ハイブリッドモードでは、ジョブの作者が特に配慮しなくても、バッチとリアルタイムの処理結果を自動的にマージできる。 ハイブリッドモードでは、同じジョブを Hadoop と Storm で同時に実行できるので、Hadoop の耐障害性

    Hadoop/Storm の統合を実現する Twitter の SummingBird - Okapies' Archive
    shiumachi
    shiumachi 2013/11/03