講師陣のみなさま セッション1:Collecting Data onto AWS ビッグデータパイプライン(Collect:収集) データを集める前に GIGO:Garbage in, garbage out 「ゴミを入れればゴミが出てくる」 データを集めることの重要性 データマイニング界の格言 More data usually beats better algorithms. (大量のデータは、高度なアルゴリズムに勝る) Deep Learning:学習データの量は重要なファクターのひとつデータを集めることの重要性 データを集める S3にデータを集める S3に集めたデータを活用しやすくする データカタログーメタデータインデックス DynamoDBに属性(メタデータ)を保存する データカタログ―サーチインデックスを作る S3ストレージインベントリ バケット内のオブジェクトのリストと、各オ
![【レポート】AWSクラウドで実現するBigData活用 | DevelopersIO](https://cdn-ak-scissors.b.st-hatena.com/image/square/495673edbefe7b7bc5e6e9e54b2565989b893342/height=288;version=1;width=512/https%3A%2F%2Fdevio2023-media.developers.io%2Fwp-content%2Fuploads%2F2013%2F09%2Faws1.png)