[B! Presto][presto] kimutanskのブックマーク

Presto at Twitter

Lessons learned while taking Presto from alpha to production at Twitter. Presented at the Presto meetup at Facebook on 2015.03.22. Video: https://www.facebook.com/prestodb/videos/531276353732033/Read less

kimutansk 2016/03/24

成熟度やプロジェクトのオープンさ、あとはネスト対応が鍵と。認可はLDAPGroupで実施しており、HDFSレベルでの認可と。

リンク

スケールアウト可能なSQLエンジンのベンチマークテスト：Presto vs Spark SQL vs Hive on Tez - GMOインターネットグループグループ研究開発本部

2015.12.22 スケールアウト可能なSQLエンジンのベンチマークテスト：Presto vs Spark SQL vs Hive on Tez １、初めに次世代システム研究室のL.G.Wです。最近リリースした関連記事推薦システム：TAXEL byGMOに携わっております。このシステムは多様なデータソースからの集計・解析・ETLが重要になるので、性能とビジネス要件を満たすSQLエンジンを選定するため、主要なSQLエンジンのベンチマークテストを実施しました。 “Small Start, Scale Fast” – 最初のハードウェアコストをなるべく低く抑え、ビジネスが拡大したらシステムも拡張できることが前提です。主にバッチ処理用途で、ある程度のリアルタイム性も要求されます（数分間～1時間内）。データの規模は数十GBから数TBくらいの想定です。主要なSQLエンジンとして、スケーラビリテ

kimutansk 2015/12/22

さすがにバージョン古すぎるような。Hive on Tezはあまり追っていませんが、PrestoやSparkSQLはすでに別物になっている気が・・・ちと残念です。

spark
presto

リンク

Presto anatomy

Presto is an open source distributed SQL query engine for running interactive analytic queries against data sources of all sizes ranging from gigabytes to petabytes. It is written in Java and uses a pluggable backend. Presto is fast due to code generation and runtime compilation techniques. It provides a library and framework for building distributed services and fast Java collections. Plugins all

kimutansk 2015/09/22

Prestoのコード生成部、この辺のライブラリ使ってましたか。コード生成は一度やったことありますがその手のOSSの知識無くて効率悪いもの作ったので見ておきますか

Presto

リンク

Presto As A Service - Treasure DataでのPresto運用事例

2. 自己紹介 Taro L. Saito @taroleo •  2002 東京大学理学部情報科学科卒 •  2007 Ph.D. –  XMLデータベース、トランザクション処理の研究 •  ~ 2014 東京大学情報生命科学専攻助教 –  ゲノムサイエンス研究 •  大規模データ処理、並列・分散コンピューティング •  2014.3月~ Treasure Data –  ソフトウェアエンジニア MPP Team Leader (Presto) 2

kimutansk 2015/04/27

G1GCに、メモリはシステムメモリの8割ほどと。バッチジョブタイプのプロセスにはG1の方がいいんですかね。

リンク

Treasure Data Tech Talk #1 開催報告 - トレジャーデータ（Treasure Data）ブログ

トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 3月11日と12日の二日間で、Treasure Dataのエンジニアによるイベント Treasure Data Tech Talk 〜クラウドサービスを支える技術〜を開催いたしました。 Treasure Data Tech Talk 〜クラウドサービスを支える技術〜 http://eventdots.jp/event/373902 Treasure Data Tech Talk 〜クラウドサービスを支える技術〜 “The Deep Day” http://eventdots.jp/event/387738 二日間で200名以上の方に参加していただき、私たちも非常に貴重な時間を過ごすことができました。参加者の皆様、会場を提供をしてくださったフリークアウトさんとDeNAさん、またイベント開催にご協力頂きましたdots

kimutansk 2015/03/16

Tech Talkの内容出ましたか。Plazmaも面白かったですが、Prestoの最適化やYARNの注意点についても非常に参考になります。

リンク

Understanding Presto - Presto meetup @ Tokyo #1

This document summarizes a presentation about Presto, an open source distributed SQL query engine. It discusses Presto's distributed and plug-in architecture, query planning process, and cluster configuration options. For architecture, it explains that Presto uses coordinators, workers, and connectors to distribute queries across data sources. For query planning, it shows how SQL queries are conve

kimutansk 2015/02/03

Prestoのプロセス管理はディスカバリサーバに対してHTTPリクエストで通知する方式でしたか。

Presto

リンク

Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo

Treasure DataではFluentdなどで収集したデータに対し、Prestoによる低レイテンシクエリサービスを提供しています。これによりユーザーはすばやくデータに関する知見を得ることができ、データ分析の生産性を向上できます。このスライドでは分散SQLエンジンであるPrestoの特徴とその実装について紹介します。この内容はdbtech showcase 2014 Tokyo @秋葉原UDX で紹介しました。 http://www.insight-tec.com/dbts-tokyo-2014.htmlRead less

kimutansk 2014/11/19

スループット重視と、レスポンス重視、どれくらいのデータ規模からどちらが有利か変わってくるんでしょうねぇ・・

Presto
SQL

リンク

SQL on Hadoop 比較検証【2014月11日における検証レポート】

Impala Meetup 2014/10/31 @Tokyo 講演資料【注意事項】本資料で紹介している検証結果は2014年当時のものです。当該ソフトウェアは成長や改善が早く、現時点のバージョンでは大きく異なる機能や性能となっています。 SQL on Hadoopの最新情報に基づくサービスやシステムインテグレーションにご興味をお持ちの方は、NTTデータ基盤システム事業本部 OSSプロフェッショナルサービス（電子メール： hadoop [AT] kits.nttdata.co.jp）にご相談ください。Read less

kimutansk 2014/11/05

Impalaは綺麗にリソース使い切るので、他のプロセスと共存するときにどうするか、は検証が必要、と・・　ディスクは大丈夫そうですが。

リンク

Presto - Hadoop Conference Japan 2014

Presto is a distributed SQL query engine that allows for interactive analysis of large datasets across various data sources. It was created at Facebook to enable interactive querying of data in HDFS and Hive, which were too slow for interactive use. Presto addresses probl ems with existing solutions like Hive being too slow, the need to copy data for analysis, and high costs of commercial databases

kimutansk 2014/07/10

複数データソースに一括クエリ発行可能／中間データをパイプラインでつないで処理分散。そのため耐障害性無くメモリに収まるサイズである必要がある／管理機能充実、と。

Presto

リンク

『Amebaのログ解析基盤にCloudera ImpalaとPrestoを導入しました』

(この記事は、Hadoop Advent Calender 2013 の12日目の記事です) こんにちは、Amebaのログ解析基盤Patriotの運用をしている、鈴木(@brfrn169)と柿島大貴です。 Patriotについては以下をご覧ください。 http://ameblo.jp/principia-ca/entry-10635727790.html http://www.slideshare.net/cyberagent/cloudera-world-tokyo-2013 今回、Amebaのログ解析基盤PatriotにCloudera ImpalaとPrestoを導入しました。 Cloudera ImpalaとPrestoのインストール方法や詳細ついては、下記URLをご覧ください。 Cloudera Impala http://www.cloudera.com/content/clo

kimutansk 2013/12/13

この位の規模だとImparaの方が早いと、ただ、「本番環境のスペック、大量データで実際に両者を使用して比較をしたほうがよい」は大事なスタンスですね

リンク

Presto: Free, Open-Source SQL Query Engine for any Data

Calling our Presto community speakers – we want to hear from you! Fill out out community call for papers to speak at upcoming meetups and conferences. What is Presto?Presto is an open source SQL query engine that’s fast, reliable, and efficient at scale. Use Presto to run interactive/ad hoc queries at sub-second performance for your high volume apps.

kimutansk 2013/11/11

速度的にはImparaの方が上のようですが、記述を見る限り対応可能なデータ量はPrestoの方が多そうなんですよね。実際どうなんでしょうか・・・

Presto

リンク

Facebook: ペタバイトのデータに対応した分散クエリエンジンをオープンソースで提供 - ワザノバ | wazanova.jp

https://www.facebook.com/notes/facebook-engineering/presto-interacting-with-petabytes-of-data-at-facebook/10151786197628920 Facebookがエンジニアブログで、ペタバイト級のデータを効率よくクエリするエンジンPrestoを紹介しています。 1) Background Facebookは世界有数の300ペタバイトのデータウェアハウスをもち、そのデータはバッチ処理、ソーシャルグラフ分析、機械学習、リアルタイムインタラクティブ分析など様々な用途に使われている。そのデータは、いくつかの大きなHadoop/HDFSベースのクラスターにある。Hadoop/MapReduce/Hiveは、大規模で信頼性の高い計算処理、全体システムスループット最適化という特性がある。しかし、ペタ

kimutansk 2013/11/07

位置づけとしてはClouderaのImparaに近いんですかね。ただ、カラムナストレージとかそのあたりの話が出てないので、BigQueryと比較すると・・どーなんでしょう。

Presto

リンク

はてなブックマーク

タグ

関連タグで絞り込む (8)

Prestoとprestoに関するkimutanskのブックマーク (12)

お知らせ

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

今週のはてなブックマーク数ランキング（2024年10月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス