タグ

AWSとAthenaに関するrAdioのブックマーク (3)

  • AWS CLIを使ってS3上にあるファイル数とファイルサイズの合計を取得する | DevelopersIO

    Amazon Athenaの料金はスキャンしたデータ量で決まるので、特定のフォルダ以下のファイルサイズの合計をAWS CLIで取得する方法を調べたのですが忘れそうなのでメモしておきます。以下のコマンドでファイル一覧の後にファイル数とサイズの合計が出力されます。 aws s3 ls s3://[バケット名]/[フォルダ名]/ --recursive --human --sum オプションの説明になります。 --human-readable(--humanだけでも可):ファイルサイズに単位をつけて見やすくしてくれるオプション --summarize (--sumだけでも可):合計サイズとオブジェクトの数を表示してくれるオプション --recursive:指定したフォルダの中にフォルダがあった場合にその中のファイルも対象にするオプション バケットごとの使用量やファイル数はCloudWatchで見

    AWS CLIを使ってS3上にあるファイル数とファイルサイズの合計を取得する | DevelopersIO
    rAdio
    rAdio 2018/07/24
    「aws s3 ls s3://{bucket}/{path}/{to}/{dir}/ --recursive --human --sum」で「du -sh /{path}/{to}/{dir}/」的なことができる、と。
  • Amazon Athena Webアクセスログ、CloudFrontのログ、CloudTrailのログのパーティション設定を自動化する | DevelopersIO

    はじめに Webアクセスログ(ELB)、CloudFrontのログ、CloudTrailのログは、YYYY/MM/DD形式のフォルダの下に自動的に保存されます。Amazon Athenaは、S3上のログファイルに対してテーブル定義して、クエリを実行できます。しかし、大量のログファイルを高速かつコスト効率よくクエリするにはパーティションを設定する必要があります。今回はこの煩雑なパーティション設定を自動化する方法をご紹介します。 カラム名あり(Hive互換)とカラム名なしのパーティション パーティションは、カラム名あり(Hive互換)パーティションとカラム名なしパーティションの2つに分類されます。 カラム名あり(Hive互換)パーティションは、フォルダ名がキーバリュー形式になっており、例えばyear=YYYY/month=MM/day=DD形式で保存されています。この形式はMSCK REPIR

    Amazon Athena Webアクセスログ、CloudFrontのログ、CloudTrailのログのパーティション設定を自動化する | DevelopersIO
  • [新機能]ワンクリックでAmazon AthenaのAWS CloudTrail用テーブルが作成できるようになりました | DevelopersIO

    こんにちは。サービスグループの武田です。 Amazon Athenaは、Amazon S3に保存されたデータを標準的なSQLで分析できるサービスです。またAWS CloudTrailは、AWSアカウント内で行われた操作のイベントログを記録できるサービスで、ログはS3に保存できます。両サービスを組み合わせることで、CloudTrailが取得したログをAthenaで分析できます。 しかしこれまでは分析用のテーブルを自分で作成する必要があり、ややハードルの高さがありました。今回のサービスアップデートで、S3バケットを指定するだけで簡単にテーブルが作れるようになりました。 AWS CloudTrail Log Search Using Amazon Athena やってみた さっそくマネジメントコンソールにアクセスしてやってみました。 まずはマネジメントコンソールからCloudTrailにアクセス

    [新機能]ワンクリックでAmazon AthenaのAWS CloudTrail用テーブルが作成できるようになりました | DevelopersIO
    rAdio
    rAdio 2018/07/19
    この「CloudTrailのデータに合わせて、Athenaの "CREATE EXTERNAL TABLE" 文を生成してくれる機能」、awscliから実行できないのかな…? それともこれ、単に決め打ちサンプルとして生成してるだけなのだろうか…。
  • 1