タグ

DWHに関するshibacowのブックマーク (2)

  • 「Amazon Redshift」を使ってみた ~使いどころと、つまずきがちなポイント

    はじめに Amazon Redshiftは、Amazon Web Services(AWS)が提供するデータウェアハウス(DWH)サービスで、2013年2月に正式リリースされ、同6月4日には東京リージョンでも利用可能になりました。既存のDWHと比較しても安価で、PostgreSQLベースで容易に高速なデータ分析が可能であることなどが知られており、注目も高まっています。 ところが、日国内では「使ってみた」という情報は非常に少ないです。幸運にも筆者は、限定プレビューの段階からRedshiftに触れる機会に恵まれました。そこで、今回は「こんな使い方をしてみました」「こんなところでつまずいた」といったことを中心に紹介したいと思います。 なお、記事は限定プレビュー~サービス開始当初の米国東部リージョンでの使用結果を元に執筆しており、当時のAPIバージョンは2012-12-01です。東京リージョン

    「Amazon Redshift」を使ってみた ~使いどころと、つまずきがちなポイント
  • 列指向RDBMSまとめ。 - sunsuk7tpのメモメモ

    はじめに 列指向RDBMS(Infobright,InfiniDB,LucidDB,MonetDB)について調査したものを以下にまとめます。 まとめ Infobright MySQL上にビルド 開発状況はプロダクション/安定、ドキュメントが充実しており、インストールなど扱いが容易そう。 圧縮性能が特に優れている=>ベンチによると0.18倍まで圧縮される Load timeは3位(4位のluciddbとは差が大きい) クエリ時間はInfiniDBより遅くてLucidDB程度。 CPU-bound=>エンジンがsingle cpu/coreしか使用できないという制限があるため。マルチコアを有効利用できない。 InfiniDB ロード時間とクエリ時間が優れている。 IO-bound=>シーケンシャルI/O(120MB/s)を十分活用してデータを処理出来ている 圧縮はしない。むしろオリジナルより増

    列指向RDBMSまとめ。 - sunsuk7tpのメモメモ
  • 1