タグ

2019年7月16日のブックマーク (9件)

  • AWS GlueでネストされたJSONファイルをCSVファイルやParquetに変換する | DevelopersIO

    はじめに AWS GlueのRelationalizeというTransformを利用して、ネストされたJSONをCSVファイルやParquetに変換する方法をご紹介します。CSV形式に変換することでリレーショナルデータベースに簡単にインポートできます。また、Parquetフォーマットに変換することでAthena、Redshift Spectrum、EMRからより高速にクエリできるようになります。 Relationalizeとは Relationalizeは、AWS Glueが提供するRelationalizeというTransformで、DynamicFrameをリレーショナル(行と列)形式に変換します。データのスキーマに基づいて、ネストした構造化データをフラットな構造化データに変換してDynamicFrameを作成します。出力は、複数の表にデータを書き込むことができる、DynamicFra

    AWS GlueでネストされたJSONファイルをCSVファイルやParquetに変換する | DevelopersIO
    yamakaz
    yamakaz 2019/07/16
  • AWS GlueのDynamicFrameの動きを見てみる | DevelopersIO

    こんにちは、小澤です。 AWS Glueでは、SparkのDataFrameではなく、DynamicFrameというものが使われているようです。 今回はこのDynamicFrameがどのような動きをするのかやGithubで公開されているライブラリからtransform処理が行われた際にどのような動きになっているのかなどをみていきたいと思います。 GitHub - awslabs/aws-glue-libs: AWS Glue Libraries are additions and enhancements to Spark for ETL operations. DynamicFrameとは DynamicFrameについては、公式ドキュメンに記載があります。 DynamicFrame Class - AWS Glue DynamicFrameはAWS Glueで独自に定義されたデータ構造

    AWS GlueのDynamicFrameの動きを見てみる | DevelopersIO
    yamakaz
    yamakaz 2019/07/16
  • AWS Glue とは - AWS Glue

    翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。 AWS Glue とは AWS Glue は、分析を行うユーザーが複数のソースからのデータを簡単に検出、準備、移動、統合できるようにするサーバーレスのデータ統合サービスです。分析、機械学習、アプリケーション開発に使用できます。また、ジョブの作成、実行、ビジネスワークフローの実装のための生産性向上に役立つツールやデータ運用ツールも追加されています。 AWS Glue を使用すれば、70 を超える多様なデータソースを検出して接続し、一元化されたデータカタログでデータを管理できます。抽出、変換、ロード(ETL)パイプラインを視覚的に作成、実行、モニタリングして、データをデータレイクにロードできます。また、Amazon Athena、Amazon EMR、Amazon Re

    yamakaz
    yamakaz 2019/07/16
  • 一休の現在と、ここまでの道のり

    フロントエンドのパラダイムを参考にバックエンド開発を再考する / TypeScript による GraphQL バックエンド開発

    一休の現在と、ここまでの道のり
    yamakaz
    yamakaz 2019/07/16
  • [Tips] Boto3でDEBUGログを出力する | DevelopersIO

    はじめに 藤です。 みなさん、AWS API/SDKを利用していますか? 今年の6月にBoto3(AWS SDK For Python)がリリースされました。 使いやすくていいですよね。 Boto3については下記エントリをご参照ください。 AWS SDK For Python (Boto3)がリリースされました! 今回はBoto3でDEBUGログメッセージを出力する方法をご紹介します。 概要 Boto3に限らずライブラリを利用する上で使い方はドキュメントで得ることができますが、トラブルシューティングとなるとドキュメントだけで追うのは難しいところです。エラーメッセージだけで原因を特定できればよいですが、どうしても汎用的なエラーメッセージで特定に至ることが難しいこともあります。ソースを読むことが出来ればよいのですが簡単ではありません。そんな時にトラブルシューティングのヒントを得るために多くの

    [Tips] Boto3でDEBUGログを出力する | DevelopersIO
  • 項目と属性の操作 - Amazon DynamoDB

    Amazon DynamoDB では、項目は属性の集まりです。各属性には名前と値があります。属性値はスカラー型、セット型、ドキュメント型のいずれかです。詳細については、「Amazon DynamoDB: 仕組み」を参照してください。 DynamoDB では、作成、読み込み、更新、および削除 (CRUD) の 4 つの基的な操作機能を使用できます。これらの操作はすべてアトミックです。 PutItem — 項目を作成します。 GetItem — 項目を読み込みます。 UpdateItem — 項目を更新します。 DeleteItem — 項目を削除します。 これらの各オペレーションでは、作業対象の項目のプライマリキーを指定する必要があります。たとえば、GetItem を使用して項目を読み込むには、その項目のパーティションキーとソートキー (該当する場合) を指定する必要があります。 4 つの

  • AWS GlueとAmazon Athenaを使用して、Amazon DynamoDBのデータ抽出と分析を簡素化 | Amazon Web Services ブログ

    Amazon Web Services ブログ AWS GlueとAmazon Athenaを使用して、Amazon DynamoDBのデータ抽出と分析を簡素化 100,000人以上のAWSユーザーが、モバイル、Web、ゲーム、アドテック、IoT、その他多くのアプリケーション向けにAmazon DynamoDBを選択しました。たとえば、DuolingoはDynamoDBを使用して、1秒あたり24,000回の読み取り容量単位と3,300回の書き込み容量単位となるテーブルに、310億アイテムを格納しています。 DynamoDBは、あらゆる規模のアプリケーションやマイクロサービスに幅広く対応できます。また、DynamoDBの多くの顧客は、DynamoDBテーブルに格納されているデータに対して、分析とアドホッククエリを実行します。このプロセスには一般的に、Amazon S3などの大規模なデータ分析

    AWS GlueとAmazon Athenaを使用して、Amazon DynamoDBのデータ抽出と分析を簡素化 | Amazon Web Services ブログ
  • プロは試作品をたくさんつくる。はじめて作る人ほど、最初から完成品を作ろうとする。|米光一成

    「グラフィックを詰めずにゲームのプロトタイプを量産する方法は現代でも通用するのか」というテキストを読んだ。 「現代においてグラフィックの伴わないプロトタイプに意味はあるのか?」という問いが書かれている。興味深い。 面白いゲームがネット上にたくさんあるのに、グラフィックがしょぼいゲームなんて誰もダウンロードしないから、“ゲームの核だけを煮詰めたプロトタイプは誰にも見向きされないまま電子の海に沈んでいきます。これではプロトタイピングの意味がありません。”と。 さらに“もはやグラフィック無しではゲームは評価の舞台にすら登れない”と述べて、先輩の意見は間違ってると解く。 ううむ。 っていう記事を過去に書いたりしてるので、応答してみる。 「グラフィックを詰めずにゲームのプロトタイプを量産する方法は現代でも通用するのか」という問いは、問いそのものが矛盾している。 システムだろうがグラフィックだろうが「

    プロは試作品をたくさんつくる。はじめて作る人ほど、最初から完成品を作ろうとする。|米光一成
    yamakaz
    yamakaz 2019/07/16
  • 「AWS Toolkit for Visual Studio Code」正式版がリリース。AWS Lambdaのステップ実行、ローカルデバッグなど可能に

    AWSはオープンソースとして開発されているコードエディタVisual Studio Codeの拡張機能として、これまでプレビュー公開されていた「AWS Toolkit for Visual Studio Code」が正式版になったことを発表しました。 AWS Toolkit for Visual Studio Codeと、AWS Command Line Interface(AWS CLI)やDockerなどを組み合わせることで、サーバレスコンピューティング環境であるAWS Lambdaのローカル環境でのステップ実行やブレークポイントの設定などのデバッグ操作などが可能になります。 そして開発したアプリケーションをAWSの任意のリージョンへのデプロイもVisual Studio Codeから手軽に行えるようになります。 AWS Lambdaのローカルデバッグが可能 AWS Toolkit f

    「AWS Toolkit for Visual Studio Code」正式版がリリース。AWS Lambdaのステップ実行、ローカルデバッグなど可能に
    yamakaz
    yamakaz 2019/07/16