タグ

druidに関するuokadaのブックマーク (4)

  • Apache Druid | Apache® Druid

    Apache® DruidDruid is a high performance, real-time analytics database that delivers sub-second queries on streaming and batch data at scale and under load. Download Join Slack GitHub Sub-second queries at any scaleExecute OLAP queries in milliseconds on high-cardinality and high-dimensional data sets with billions to trillions of rows without pre-defining or caching queries in advance. High concu

    Apache Druid | Apache® Druid
    uokada
    uokada 2019/03/17
  • ストリーム処理を支えるキューイングシステムの選び方

    This document discusses messaging queues and platforms. It begins with an introduction to messaging queues and their core components. It then provides a table comparing 8 popular open source messaging platforms: Apache Kafka, ActiveMQ, RabbitMQ, NATS, NSQ, Redis, ZeroMQ, and Nanomsg. The document discusses using Apache Kafka for streaming and integration with Google Pub/Sub, Dataflow, and BigQuery

    ストリーム処理を支えるキューイングシステムの選び方
  • Apache HiveとDruidを使ったリアルタイムSQL

    IoTやAIのユースケースがますます増えているのなか、ビッグデータをリアルタイムにSQLでクエリする需要が高まっている。こちらを実現するソリューションとして、Apache Hive と Druid の組合せが魅力です。 Apache Hive と Druid とも実績の高いオープンソースソフトウェア(OSS)。 両方とも非常に大量のデータでも対応できるスケールアウト・アーキテクチャ。 Apache Hive と Druid 自体や依存コンポネント全ては、Apache Ambariを使ってGUIウィーザーでインストール可能。 簡単な設定だけで連携可能。 今回はApache HiveとDruidを使ったリアルタイムSQL処理を、サンプルみながら説明する。 Apache Hive 2とは Apache HiveはHadoop上のSQLデータ・ウェアハウスです。最新のHive 2.2は新しいLLA

  • druidというリアルタイムデータ分析ツールを知った | κeenのHappy Hacκing Blog

    κeenです。社内ハッカソンに出てきた。そこでdruidというツール(?)を触ったのでそれについて。 読み方は「ドゥルイド」でいいのかな?公式ページはこちら。Metamarketsが主導で開発しているようで、オープンソースになっている。 公式サイトを少し回遊してもらうと分かると思うが、時系列データを分散環境でストリーミング処理出来るツール。分散環境で動くだけあってコンポーネントはいくつかある。 主にはストリーミングデータを取り込む「REALTIME」、クライアントからのクエリを処理する「BROKER」、過去のデータを処理する「HISTORICAL」があるようだ。 BROKERがDEEP STORAGE(s3などの永続データストア)にデータを保存し、HISTORICALがオンデマンドにそのデータを読み出してBROKERに返す。 イメージとしてはこんな感じだが、実際に動かすのには他のコンポーネ

    druidというリアルタイムデータ分析ツールを知った | κeenのHappy Hacκing Blog
  • 1