[B! athena] operandoのブックマーク

operando id:operando

athenaに関するoperandoのブックマーク (2)

Presto ベースのマネージドサービス Amazon Athena
Presto Meetup 201706 の発表資料です． https://techplay.jp/event/621143
operando 2020/03/26
athena
リンク
Athenaでパーティション数が増えた時のパフォーマンスを計測してみた。 - Qiita
はじめに弊社では、ビッグデータ分析のためにAWSのクエリサービスAmazon Athenaをよく利用しています。簡単に使い始めることができて、本当に便利なサービスです。 SQL on Hadoopでは、パーティション数が多くなりすぎるとクエリ実行時間が長くなるので、「パーティションの数は多くとも1万個くらいに抑えましょう」という定石があります1。一方、Athenaではクエリ実行時に、スキャンしたデータ量に応じて $5/1TB 課金されます。パーティションを細分化しておけば、スキャンするデータ量が削減できます。結局のところ、パーティションをどれくらい細分化すれば良いかは、定石だけではわかりません。さて、我々のシステムでは、次々と送られてくる発生するログをS3に配置し、EMRで日次ETL処理した結果をAthenaで分析・集計します。クエリ対象期間は1週間固定であるにもかかわらず、
operando 2020/03/26
athena

sql
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx