タグ

qiitaとextract-transform-loadに関するnabinnoのブックマーク (2)

  • AWS Glueとは何か? - Qiita

    こいつに入門します。 一言でいうと… マネージドETLサービスです。 ETLとは「Extract/Transform/Load」の略で、分析用に様々なデータを集める際に発生する「取り出す/変換する/取り込む」というプロセスを表しています。 Glueとは「糊」のことで、ETLにおいてAWSのリソースとリソースを繋ぐことの比喩になっているようです。 ※ややこしいですがDevOps Guruというサービスも最近出現しています。このGuruは「賢者」を表す別単語で、機械学習を活用した賢いサービスを比喩しているものと思われます。 Glueの概念図 データソースから取り込んだデータをETLジョブで加工し、ターゲットに格納して分析などに利用します。 Glueのコンポーネント データカタログ ETL処理をしたいデータのメタデータを管理するもの。元データ(データソース)からGlueのクローラーで抽出してきた

    AWS Glueとは何か? - Qiita
  • AWS Glue DataBrewを試してみた - Qiita

    はじめに この記事は BeeX Advent Calendar 2020 の12/21の記事です。 == 今回は11/13に発表されたAWS Glue DataBrewを試していきます。 AWS Glue DataBrew の発表 AWS公式の以下ドキュメントを元にして進めます。 AWS GLue DataBrewの概要 AWS Glue DataBrewとは AWS公式には、Glue DataBrewとは「コードを記述せずにデータをクリーンアップおよび正規化できるビジュアルデータ準備ツール」と記載されています。 簡単に言うと、今までデータ分析などで行っていた前処理をノーコードで行うことができ、かつサーバレス構成でインフラの管理もAWSに任せてしまえるサービスになります。 便利。 今回のゴール Glue DataBrewの操作方法が何となくでも理解できること チュートリアルを元に構築ができ

    AWS Glue DataBrewを試してみた - Qiita
  • 1