タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

athenaに関するwanijiのブックマーク (5)

  • Private Presentation

    Private content!This content has been marked as private by the uploader.

    Private Presentation
  • ELB のアクセスログを Parquet 形式に変換して、Amazon Athena からクエリする #reinvent | DevelopersIO

    そこで今回は下記ブログで紹介されている ELB のアクセスログを Parquet 形式に変換する手順を試してみました。 S3のデータをAmazon Athenaを使って分析する 試してみた 今回の流れは以下のようになります。 EMR クラスタ立ち上げ スクリプトダウンロード データ変換 変換したデータを S3 へ転送 Amazon Athena からクエリ EMR クラスタ立ち上げ データ変換するスクリプトを実行する EMR クラスタを立ち上げます。 マネジメントコンソールから EMR の画面を遷移します。 Create cluster から立ち上げる EMR クラスタを設定します。 Go to advanced options から詳細設定します。 今回は Spark を利用するので Spark をチェックします。 インスタンスは Core node に r3.8xlarge を 4台利

    ELB のアクセスログを Parquet 形式に変換して、Amazon Athena からクエリする #reinvent | DevelopersIO
  • Amazon AthenaでELBログをSQLで解析する #reinvent | DevelopersIO

    西澤です。目新しさの無いエントリーですが、溜め込んだELBログを解析する必要があったので試してみることにしました。Amazon Athenaは東京リージョンでは使えないので、OregonリージョンのAthenaから、東京リージョンのS3バケットをデータソースとして検証しました。 と言ってもほぼ下記ページにやり方は詳しく載っていますので、公式ページを見ていただく形でも構いません。 Analyzing Data in S3 using Amazon Athena | AWS Big Data Blog Athenaでデータベースを作成する データベースエンジニアで無い担当者からすると、専用のSQLクライアントを用意すること無く、AWS Management Console上で全ての操作が完結するというのは大変嬉しいです。GUIで操作することもできますが、テーブルを作成するデータベースを先に別に

    Amazon AthenaでELBログをSQLで解析する #reinvent | DevelopersIO
  • AWS Athena雑感 - Go ahead!

    Amazon Athena — Serverless Interactive Query Service - AWS Prestoのフォースを感じたので,知り合いが試した情報も含めて,今思っている所を書いてみる. 実装 Athenaのページにあるように,実行エンジンは独自実装ではなくて,Facebookが公開しているPrestoを使っている.FacebookのみならずTreasure Data,Airbnb,Netflixなどクエリがガンガン飛ぶ環境で元気に動いている実績もあるので,拡張性,パフォーマンス,安定性で選ばれたのだろうと思われる.あとAWS的にJavaの方が相性は良さそう. パフォーマンス いくつかの記事で言及されている. Analyzing Data in S3 using Amazon Athena Amazon AthenaをBigQueryと比較してみた Amazon

  • Amazon AthenaをBigQueryと比較してみた

    こんにちは、データ分析部の阿部です。 作業中音楽は聞かない派ですが、ホワイトノイズを聞いていると集中できるという噂を聞いたことがあるので少し気になっています。 今回は、re:Invent2016で発表されたばかりのAthenaを紹介します。 Athenaとは データの準備 テーブル作成 速度測定 まとめ Athenaとは 日、AWSのre:Invent中で、RedshiftやEMRに続くビッグデータサービスとして、Athenaというサービスがリリースされました。 Athenaは、S3上のデータ(CSV, JSON, その他フラットファイル)に対して、インタラクティブにSQLを実行することができます。 RedshiftやEMRに比べて、クラスタの構築や運用を必要とせず、シンプルにクエリを実行できるというメリットがあります。 課金形態も、クエリ&読み込んだデータ量に応じて課金という点で、Go

    Amazon AthenaをBigQueryと比較してみた
  • 1