[B! data-engineering] nabinnoのブックマーク

nabinno id:nabinno

data-engineeringに関するnabinnoのブックマーク (195)

Upsolver: Manage, Integrate & Structure Streaming Data - Easily
Empower software engineers to prepare and deliver the most complex application data for analytics & AI, in minutes! Enjoy the cost savings and scale of a cloud-native Lakehouse, without the engineering pain.
nabinno 2024/09/26
upsolver

extract-transform-load

data-engineering
リンク
Upsolver、Amazon Athena、Amazon QuickSight を使用して Google Analytics データを分析する | Amazon Web Services
Amazon Web Services ブログ Upsolver、Amazon Athena、Amazon QuickSight を使用して Google Analytics データを分析するこの記事では、Amazon Athena を使用して Google Analytics データを分析するためのソリューションを紹介します。Google Analytics から Amazon S3 にヒットレベルのデータを移動し、結合と強化を実行し、Amazon Athena と Amazon QuickSight を使用してデータを視覚化することで構築されたリファレンスアーキテクチャが含まれています。Upsolver は、顧客が迅速にデータレイクの自動化やオーケストレーションを開始できるようにします。 Google Analytics は、ウェブプロパティとアプリケーションのパフォーマンスを理解し
nabinno 2024/09/26
roy-hasson

upsolver

google-analytics

amazon-athena

amazon-quicksight

data-engineering
リンク
[Track_B][13:40-14:00]サポーターセッション：AWSとZendeskが繋がったら、楽しいの？美味しいの？嬉しいの？ | JAWS DAYS 2021
[Track_B][13:40-14:00]サポーターセッション：AWSとZendeskが繋がったら、楽しいの？美味しいの？嬉しいの？セッション内容日本でも近年少しずつ知名度を上げつつあるカスタマーコミュニケーションプラットフォーム"Zendesk"。APIが充実していてハック要素満載のZendeskとAWSを連携させると、どこが楽しくて、何が美味しくて、どう嬉しいのか？ Zendesk導入実績APAC No.1のエクレクトのAWSを愛してやまないプリセールスエンジニアが具体的な構成パターンを紹介しながらAWS-Zendesk連携の魅力を語ります。登壇者株式会社エクレクト逢坂文哉株式会社エクレクトプリセールスエンジニア資料
nabinno 2024/09/26
jaws

zendesk

amazon-appflow

data-engineering
リンク
S3のコスト削減に成功した話〜カギはバッチウィンドウ〜｜ハンズラボ株式会社
こんにちは！POSグループのhktです。こちらの記事は、「S3のコスト削減に失敗した話」の後編になります。もしまだ前編をご覧になっていない方は、ぜひ読んでみてください。さて、前編では、S3のコストを調査したところ、最も費用がかかっているのがPutObjectであることが判明しました。今回は、S3のコストを削減するために、PutObjectの実行回数を減らすことはできないか検討しました。 PutObjectの実行回数を減らしたい POSグループが運用するAWSアカウントでは、ログデータをS3に保存するために、Kinesis Data StreamsをトリガーとするLambda関数が稼働しています。具体的には、以下のような構成になっています。HandsPOSアプリからKinesis Data Streamsにログデータが送信され、Kinesis Data StreamsからLambd
nabinno 2024/09/25
hands-lab

aws-lambda

batch-processing

window

data-engineering
リンク
データのランディングゾーン - Cloud Adoption Framework
このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカルサポートを利用できます。
nabinno 2024/09/22
microsoft-azure

landing-zone

data-engineering

data-management
リンク
[GA4] BigQuery Export - アナリティクスヘルプ
BigQuery は、大規模なデータセットに対しパフォーマンスの高いクエリを実行できるクラウドデータウェアハウスです。すべての未加工のイベントを Google アナリティクス 4 プロパティ（サブプロパティや統合プロパティを含む）から BigQuery にエクスポートし、SQL タイプの構文を使ってそれらのデータにクエリを発行できます。BigQuery では、アナリティクスのデータとの統合を目的に、データを外部ストレージにエクスポートすることや、外部データをインポートすることが可能です。データを BigQuery にエクスポートすると、そのデータの所有者になり、BigQuery ACL を使用して、プロジェクトやデータセットの権限を管理できます。 1 日 1 回、すべてのデータのエクスポートが行われます。さらに、データのエクスポートは 1 日を通して継続的に実行されます（詳しくは下
nabinno 2024/09/20
google-analytics

google-cloud-bigquery

data-engineering
リンク
Data mesh - Wikipedia
nabinno 2024/09/10
data-mesh

domain-driven-design

data-warehouse

data-engineering
リンク
ラムダアーキテクチャ
ラムダアーキテクチャとはラムダアーキテクチャとは、膨大なデータ「ビッグデータ」を処理するアプローチです。ハイブリッドアプローチを使用してバッチ処理やストリーム処理メソッドへのアクセスを提供し、任意の関数を計算する問題を解決するために使用されます。ラムダアーキテクチャは3つのレイヤーから構成されています。バッチレイヤー新しいデータは、データシステムへのフィードとして継続的に提供されます。データはバッチレイヤーとスピードレイヤーに同時に供給されます。全てのデータを一度に調べ、最終的にストリームレイヤー内のデータを修正します。ここでは、多くの ETL と従来型のデータウェアハウスを見つけることができます。このレイヤーは、通常 1 日に 1 回または 2 回、事前定義されたスケジュールを使用して構築されます。バッチレイヤーには、次の 2 つの重要な機能があります。マスターデータセットの管理バッ
nabinno 2024/09/08
databricks

lambda-architecture

data-engineering
リンク
ストリーム処理を１からKappa Architectreまで学ぶ | PLAID engineer blog
ビッグデータよりストリームデータの時代！KARTEのリアルタイム解析でも使われているストリーム処理について学んでみる。
nabinno 2024/09/08
plaid

makoto-kataigi

lambda-architecture

kappa-architecture

data-engineering
リンク
匿名加工情報｜株式会社EMシステムズ
当社は、当社が保有する以下の個人情報について、特定の個人を識別すること及び個人情報の復元ができないよう適切な措置を講じた上で匿名加工情報として継続的に作成し、第三者提供を行いますので下記の通り公表します。
nabinno 2024/08/05
em-systems

data-masking

privacy

data-engineering
リンク
仮名加工化の実践データ分析基盤における挑戦と学び
©2023 10X, Inc. 自己紹介 • 水谷優斗 ◦ 各種id: @tenajima • 株式会社10X データ基盤チームデータエンジニア ◦ 2023年2月入社 ◦ 小売企業企業へのダッシュボードの提供、社内データ基盤の運用 • 経歴 ◦ Fringe81(現Unipos) にデータサイエンティストとして新卒入社 ◦ データサイエンティストとして広告基盤の改善に取り組んだり、 HR SaaSのデータ活用に取り組んだり ◦ 2021年4月頃からデータ分析基盤の作成、社内のデータ活用に取り組むようになる • 趣味 ◦ 野球とワンピースはじめにに ©2023 10X, Inc. 提供プロダクトお客様アプリ • 数万SKUから商品からスムーズにカゴを作成できるUX • キーワード・カテゴリ検索・お気に入り・注文変更・購入履歴といった基本機能 • 商品の受け取り方法を選択 • 注文
nabinno 2024/07/14
speaker-deck

10x

yuto-mizutani

data-masking

hash-function

data-engineering
リンク
ステージングデータ | Snowflake Documentation
ステージングデータ¶ このトピックでは、データファイルをロード用に準備するためのベストプラクティス、一般的なガイドライン、および重要な考慮事項について説明します。このトピックの内容：パスによるデータの整理¶ 内部（つまり、Snowflake）および外部（Amazon S3、Google Cloud Storage、またはMicrosoft Azure）両方のステージ参照には、パス（または AWS の用語ではプレフィックス）を含めることができます。通常のデータセットをステージングするときは、データが書き込まれた日付とともに、地理的位置やその他のソース識別子などの詳細を識別する論理パスにデータをパーティション分割することをお勧めします。パスごとにデータファイルを整理すると、1つのコマンドで分割データの一部をSnowflakeにコピーできます。これにより、並列操作を利用して、ファイルのサ
nabinno 2024/07/11
snowflake

data-engineering
リンク
Data lineage - Wikipedia
This article contains wording that promotes the subject in a subjective manner without imparting real information. Please remove or replace such wording and instead of making proclamations about a subject's importance, use facts and attribution to demonstrate that importance. (May 2015) (Learn how and when to remove this message) Data lineage includes the data origin, what happens to it, and where
nabinno 2024/07/10
data-lineage

data-flow

data-engineering

data-management
リンク
Data Engineering Study #24 データドリブン組織を支える技術
nabinno 2024/07/01
movie

jun-okumura

data-engineering

data-management

analytics
リンク
Evolution of Eureka’s Data Platform
nabinno 2024/07/01
medium

kirill-denisenko

data-engineering
リンク
AWS DMS data validation - AWS Database Migration Service
nabinno 2024/06/24
aws-dms

validation

data-migration

data-engineering
リンク
スタースキーマ(基礎)
スタースキーマ wikipedia スタースキーマまたは星型スキーマはデータウェアハウスに利用される最も単純なスキーマである。スタースキーマには唯1つもしくは少数のファクト表と複数のディメンション表が含まれる。スタースキーマはスノーフレークスキーマの一種であるが、多くの用途で利用されている。スタースキーマは、ディメショナル・モデリングをリレーショナル・データベースで実装したものになる。詳しくは、ディメンショナル・モデリングにまとめている。この記事は、あなたが「様々な指標を様々な軸で、レポートを見たい」類の要望に応えるためのスキーマ設計に困っている場合に役立つだろう。ディメンションテーブル設計サロゲートキースタースキーマでは、各ディメンションテーブルに、サロゲートキーを割り当てる。このキーは、業務システムで使われているキー（ナチュラルキー）とは別のものを使用し、データウェ
nabinno 2024/06/20
zenn

star-schema

data-warehouse

analytics

data-engineering
リンク
複数スタースキーマ
複数スタースキーマ(Multiple star schema) 1つのファクトで、全ての分析対象がカバー出来ることは稀である。ほとんどのケースで複数のファクトテーブルが必要になるだろう。本当に価値ある分析は複数のプロセスを横断した分析である。これを誤った方法で実現するとどうなるか？どうすれば良いのかを見ていく。スタースキーマの作り方に関しては、別の記事にまとめている。発生タイミングが異なるファクト 2つ以上のファクトがあったとする。それらは同時に発生しないファクトである場合、異なるファクトテーブルに配置するべきである。誤って単一ファクトテーブルにまとめられると、個々の分析が困難になる。もし分けていれば個々に分析が可能になる。ある営業部門で以下のような分析要件があったとする。日付、顧客、製品別注文数量の分析日付、顧客、製品別出荷量の分析ディメンションは日付と顧客。ファクトは製品
nabinno 2024/06/20
zenn

star-schema

olap

data-warehouse

analytics

data-engineering
リンク
既存のスキーマをクローラーで変更しないための方法 - AWS Glue
Amazon S3 テーブル定義の既存のフィールドに対する更新をクローラーで上書きしない場合は、コンソールでオプションとして [Add new columns only] (新しい列の追加のみ) を選択するか、設定オプションとして MergeNewColumns を設定します。これはテーブルとパーティションに適用されます (Partitions.AddOrUpdateBehavior を InheritFromTable で上書きしていない場合)。クローラーの実行時にテーブルスキーマを一切変更しない場合は、スキーマ変更ポリシーを LOG に設定します。設定オプションにより、テーブルから継承するようにパーティションスキーマを設定することもできます。コンソールでクローラーを設定する場合は、以下のアクションを選択できます。変更を無視し、Data Catalog のテーブルを更新しないすべ
nabinno 2024/06/14
aws-glue

data-engineering
リンク
安全なクラウドネイティブ実現へ：内製開発におけるプロダクトセキュリティ強化の軌跡と開発チームとの協調 - CNDT2023 | ドクセル
nabinno 2024/06/05
docswell

nikkei

naohiro-fujita

data-engineering

security-engineering
リンク
1 2 3 4 5 6 7 8 9 10 次のページ