タグ

MPPに関するkimutanskのブックマーク (3)

  • Hadoop Source Code Reading #17

    Impala Meetup 2014/10/31 @Tokyo 講演資料 【注意事項】 資料で紹介している検証結果は2014年当時のものです。当該ソフトウェアは成長や改善が早く、現時点のバージョンでは大きく異なる機能や性能となっています。 SQL on Hadoopの最新情報に基づくサービスやシステムインテグレーションにご興味をお持ちの方は、NTTデータ 基盤システム事業部 OSSプロフェッショナルサービス(電子メール: hadoop [AT] kits.nttdata.co.jp) にご相談ください。

    Hadoop Source Code Reading #17
    kimutansk
    kimutansk 2014/09/23
    Sparkとの違いはデータフローの動的最適化有/RDDは無い/既存のMRそのまま使える、と。
  • Cloudera Blog

    kimutansk
    kimutansk 2014/09/05
    インメモリのデータを一律検索可能なMPP管理機能=MicroStrategy、と。横断的に出来るようになりますか。
  • MPP on Hadoop, Redshift, BigQuery - Go ahead!

    Twitterで「早く今流行のMPPの大まかな使い方の違い書けよ!」というプレッシャーが半端ないのでてきとうに書きます.この記事は俺の経験と勉強会などでユーザから聞いた話をもとに書いているので,すべてが俺の経験ではありません(特にBigQuery).各社のSAの人とかに聞けば,もっと良いアプローチとか詳細を教えてくれるかもしれません. オンプレミスの商用MPPは使ったことないのでノーコメントです. MPP on HadoopでPrestoがメインなのは今一番使っているからで,Impalaなど他のMPP on Hadoop的なものも似たような感じかなと思っています. もちろん実装の違いなどがあるので,その辺は適宜自分で補間してください. 前提 アプリケーションを開発していて,そのための解析基盤を一から作る. 簡単なまとめ データを貯める所が作れるのであれば,そこに直接クエリを投げられるPre

    kimutansk
    kimutansk 2014/07/25
    自前でデータストアを管理するクエリエンジンと、マネージドサービスのRedshift/Big Queryで・・という感じですが、微妙に違うと。
  • 1