タグ

Prestoに関するeigo_sのブックマーク (5)

  • Presto: Free, Open-Source SQL Query Engine for any Data

    Fast and Reliable SQL Engine for Data Analytics and the Open Lakehouse What is Presto? Presto is an open source SQL query engine that's fast, reliable, and efficient at scale. Use Presto to run interactive/ad hoc queries at sub-second performance for your high volume apps.

  • スケーラブルな分散SQLエンジン「Presto」の開発団体「Presto Software Foundation」が発足

    スケーラブルな分散SQLエンジンとして大規模データに対して高速なクエリを実現する「Presto」は、2013年にFacebookが公開したオープンソースソフトウェアです。 現在でもFacebookをはじめTwitter、Uber、Netflix、ウォルマートなどがデータ分析などに利用しているとされています。 そのPrestoの開発者たちが、Prestoの開発を促進する団体「Presto Software Foundation」の設立を発表しました。 設立を発表するブログには、Presto Software Foundationの役割を次のように説明しています。 The Presto Software Foundation is dedicated to preserving the vision of high quality, performant and dependable soft

    スケーラブルな分散SQLエンジン「Presto」の開発団体「Presto Software Foundation」が発足
  • AWS Athena雑感 - Go ahead!

    Amazon Athena — Serverless Interactive Query Service - AWS Prestoのフォースを感じたので,知り合いが試した情報も含めて,今思っている所を書いてみる. 実装 Athenaのページにあるように,実行エンジンは独自実装ではなくて,Facebookが公開しているPrestoを使っている.FacebookのみならずTreasure Data,Airbnb,Netflixなどクエリがガンガン飛ぶ環境で元気に動いている実績もあるので,拡張性,パフォーマンス,安定性で選ばれたのだろうと思われる.あとAWS的にJavaの方が相性は良さそう. パフォーマンス いくつかの記事で言及されている. Analyzing Data in S3 using Amazon Athena Amazon AthenaをBigQueryと比較してみた Amazon

  • プランナーよりのログ解析基盤のその後 - wyukawa's diary

    以前2種類のログ解析基盤 - wyukawa’s blogで書いたログ解析基盤のうち2つ目のプランナーよりのシステムが現在どうなっているかを書いてみたいと思います。 ちなみに1つ目のエンジニアよりのシステムの方も更新はあって、Fluentd+Norikra+Elasticsearch+Kibanaによるリアルタイムモニタリングを始めたり、メルカリでのNorikraの活用、 Mackerelを添えてを真似て、Norikraにクエリを登録したらGrowthForecastに自動でグラフが出来るようにしたり、Norikraでアプリログを集計してリアルタイムエラー通知 # Norikra meetupと少し似ている、Norikraにクエリを登録してログに特定のキーワードがあったらHipChatに通知するようにしたり、といったことをしています。 2つ目のプランナーよりのシステムの全体像はこんな感じで

    プランナーよりのログ解析基盤のその後 - wyukawa's diary
  • MPP on Hadoop, Redshift, BigQuery - Go ahead!

    Twitterで「早く今流行のMPPの大まかな使い方の違い書けよ!」というプレッシャーが半端ないのでてきとうに書きます.この記事は俺の経験と勉強会などでユーザから聞いた話をもとに書いているので,すべてが俺の経験ではありません(特にBigQuery).各社のSAの人とかに聞けば,もっと良いアプローチとか詳細を教えてくれるかもしれません. オンプレミスの商用MPPは使ったことないのでノーコメントです. MPP on HadoopでPrestoがメインなのは今一番使っているからで,Impalaなど他のMPP on Hadoop的なものも似たような感じかなと思っています. もちろん実装の違いなどがあるので,その辺は適宜自分で補間してください. 前提 アプリケーションを開発していて,そのための解析基盤を一から作る. 簡単なまとめ データを貯める所が作れるのであれば,そこに直接クエリを投げられるPre

  • 1