[B! s3][glue] urza358のブックマーク

urza358 id:urza358

s3とglueに関するurza358のブックマーク (1)

Athenaで気軽にS3のデータを集計する - Qiita
S3のJSONを気軽にAthenaで集計したいと思い、安く済ます方法を調べた。事前の印象では結構なお値段かかってしまうものだと思っていたが、小さいデータを最低コストで集計する分にはかなり安く済みそうだった。ということで、ここでやりたいのは、 S3の小さいデータを気軽に安く SQLで集計するということで、RDSなど立てるのはもってのほかである。前提知識パーティションデータをパーティション分割することで、各クエリでスキャンするデータの量を制限し、パフォーマンスの向上とコストの削減を達成できます。Athena では、データのパーティション分割に Hive を使用します。すべてのキーでデータをパーティション化できます。一般的な方法では、時間に基づいてデータをパーティション分割します。これにより、通常、複数レベルのパーティション構成となります。たとえば、1 時間ごとに配信されるデータ
urza358 2021/03/17
aws

athena

s3

glue
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx