タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

prestoに関するsuzukaze7のブックマーク (2)

  • Presto+MySQLで分散SQL

    This document discusses Presto, an open source distributed SQL query engine for interactive analysis of large datasets. It describes Presto's architecture including its coordinator, connectors, workers and storage plugins. Presto allows querying of multiple data sources simultaneously through its connector plugins for systems like Hive, Cassandra, PostgreSQL and others. Queries are executed in a p

    Presto+MySQLで分散SQL
  • Prestoを試してみた - すだちっこのOrdinary Days

    Prestoを試してみたのでまとめておきます。 Prestoとは Presto Facebookが開発したSQLクエリエンジンです。 HDFS上のデータに対してSQLで処理が出来ます。 HiveでもSQLライクに処理は出来るのですがHiveはMapReduceで動作する為、処理が遅く PrestoはMapRedcueを使わない為、高速に処理できます(ImpalaもPrestoと同様) Prestoアーキテクチャ こちら にあるとおりCoodinatorとWorkerで動作します。 HiveのMetadataを参照してHDFS上のデータを読み込みます。 検証構成 サンプルデータはこちらを使用しました。 HDFSとHiveの構築はCloudera-managerからサクッと行いました。 今回はCoordinator1台+Worker2台構成です。 Prestoインストール こちらを参考にインス

    Prestoを試してみた - すだちっこのOrdinary Days
  • 1