タグ

2023年11月10日のブックマーク (10件)

  • データ処理基盤に関わる基本概念

  • ディメンショナルモデルの実導入と実装について | ドクセル

    スライド概要 2023年3月22日(水) に「TECH PLAY Data Conference 2023」で ソリューション事業部データ統括部データ基盤部ゲームデータグループ 渡辺 ブルーノ / 濱田 識 が登壇した資料です。 概要: 今までのDeNAのデータモデリングの課題とディメンショナルモデルを採用した経緯、その実装から得られた知見を紹介しております。 イベント: https://techplay.jp/event/892259

    ディメンショナルモデルの実導入と実装について | ドクセル
  • 【インターンレポート】LINEの大規模ETL batch pipelineにおけるdbtの導入によるデータ分析での課題解決の検証

    LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは、早稲田大学政治経済学経済学科 学部3年の滝田愛澄と申します。2023年8月7日から6週間、LINE株式会社のIU Data Connectチームにて、就業型インターンシップに参加させていただきました。インターンでは、LINEの大規模ETL batch pipelineであるVinitusが現在抱えている課題を解決することを目的に、data build tool (dbt) の調査とdbtを用いた新たなworkflowのプロトタイプの設計・実装に取り組みました。このレポートでは、現在のVinitusが抱えている課題を確認し、dbtの導入によってどのようにそれらの課題を解決できるか、具体的にこのプロトタイプでは何をど

    【インターンレポート】LINEの大規模ETL batch pipelineにおけるdbtの導入によるデータ分析での課題解決の検証
    ikosin
    ikosin 2023/11/10
  • 2022/09/24 Data Vault 2.0 輪読会に参加しました - /home/by-natures/dev*

    今年の春〜初夏にかけて Data Vault 2.0 についての輪読会に参加しました。途中は退職転職などでバタバタしていて参加できなかったのですが、Data Vault の概念を理解でき、dbt などの ETL ツールについての話題も多く、とても勉強になりました。色々と感想を書こうとしていたのですが新しい会社で学ぶことが多く、業務後や週末はのんびりしていることが多かったので、雨続きの三連休ですが久しぶりに個人的な勉強をまた始めています。 Data Vault ですが、ディメンショナルモデリングを置き換えるものではないと明言されています。むしろディメンショナルモデリングでデータマートを組みやすいように、前段のデータウェアハウスを管理しておくための技術やモデリング手法のようです。 輪読したのはこちらのです: Amazon | Building a Scalable Data Warehou

    2022/09/24 Data Vault 2.0 輪読会に参加しました - /home/by-natures/dev*
  • Data Vault モデリングのご紹介 - Safie Engineers' Blog!

    データ分析基盤グループでデータエンジニアをしている平川です。 近年注目されてきているDataVaultに関して、全3回(予定)で記事を書かせていただく予定です。 第1回の記事では、DataVaultとは何なのか?どんな特徴があるのかを書いていきます。 参考までに、1~3回の内容を紹介しておきます。(内容は変わる可能性が大いにありますのでお許しください🙇‍♂️) 第1回: DataVaultってなに?どんな特徴があるの? ← 今回はここ 第2回: dbtvaultを使って実際にDataVaultモデリングでテーブルを作ってみた 第3回: BusinessVaultの使い所や特徴的なSatelliteの利用におけるハマったところや良いところ これまでのデータモデリング手法 3NF ディメンショナルモデリング DataVaultとは何か? Hub Link Satellite モデリングにおけ

    Data Vault モデリングのご紹介 - Safie Engineers' Blog!
  • データ分析を支える技術 データモデリング再入門

    Developers IO 2022 データ分析を支える技術 データモデリング再入門 「仏作って魂入れず」ということわざがありますが、データモデリングせずにDWHという「器」を導入しただけでは、データ分析は捗りません。 DWHのデータモデリングとは何か、代表的なDWHのデータモデリング手法の紹介と、長所・短所、選定のポイントについて解説します。 ■アジェンダ ・DWHのデータモデリング ・ビル・インモンさんのDWHのデータモデリング ・ラルフ・キンボールさんのディメンショナルモデリング ・DWHアプローチの選択 ・Data Vault モデリング(Data Vault 2.0) ・まとめ ■DevelopersIO 2022の詳細はこちら 「DevelopersIO 2022」公式サイト https://classmethod.jp/m/developers-io/ ■出演者プロフィール

    データ分析を支える技術 データモデリング再入門
  • スタースキーマ(基礎)

    スタースキーマ wikipedia スタースキーマ または 星型スキーマ はデータウェアハウスに利用される最も単純なスキーマである。スタースキーマには唯1つもしくは少数のファクト表と複数のディメンション表が含まれる。スタースキーマはスノーフレークスキーマの一種であるが、多くの用途で利用されている。 スタースキーマは、ディメショナル・モデリングをリレーショナル・データベースで実装したものになる。 詳しくは、ディメンショナル・モデリング にまとめている。 この記事は、あなたが「様々な指標を様々な軸で、レポートを見たい」類の要望に応えるためのスキーマ設計に困っている場合に役立つだろう。 ディメンションテーブル設計 サロゲートキー スタースキーマでは、各ディメンションテーブルに、サロゲートキーを割り当てる。このキーは、業務システムで使われているキー(ナチュラルキー)とは別のものを使用し、データウェ

    スタースキーマ(基礎)
  • ナメやがってこの型ァ!!超イラつくぜぇ~~~~~ッ!!

    const colors = ["赤","青"] as const; type Colors = typeof colors[number]; //"赤" | "青" typeof colors[number]・・・ってよォ~~~~~ typeofはわかる。スゲーよくわかる TypeScritの世界では、typeofで変数から型を作れるんだよなァ だがnumberってのはどういう事だああ~~~~っ!? 配列にnumberを渡せるかっつーのよ───────ッ!! ナメやがってこの型ァ!! 超イラつくぜぇ~~~~ッ!! 解説 これはよォ 「Lookup Type」ってやつらしいぜぇ たとえばよォ 👇みたいに書くとPerson型からプロパティの型を取り出せるよなァ~?? type Person = { name: string, age: number } type name = Person

    ナメやがってこの型ァ!!超イラつくぜぇ~~~~~ッ!!
  • OLTP と OLAP の比較 - データ処理システムの違い - AWS

    オンライン分析処理 (OLAP) とオンライントランザクション処理 (OLTP) は、ビジネスデータの保存と分析に役立つデータ処理システムです。ウェブサイト、アプリケーション、スマートメーター、内部システムなど、複数のソースからデータを収集して保存できます。OLAP はデータを組み合わせてグループ化するため、さまざまな観点から分析できます。逆に、OLTP はトランザクションデータを確実かつ効率的に、大量に保存および更新します。OLTP データベースは、OLAP システムの複数のデータソースの 1 つになります。 OLAP について読む » オンライン分析処理 (OLAP) とオンライントランザクション処理 (OLTP) はどちらも、大量のデータを保存および処理するためのデータベース管理システムです。スムーズに稼働するには、効率的で信頼性の高い IT インフラストラクチャが必要です。両方を使

    OLTP と OLAP の比較 - データ処理システムの違い - AWS
  • OpenTelemetry 良い感じ - 誰かの役に立てばいいブログ

    最初に断っておきますと、OpenTelemetry を良く知っていたり真面目に調査しようという人が読むべき内容はここにはありません。 公式ドキュメントなりをご参照ください。これは最近 OpenTelemetry を使いだした一般人の感想記事です。 さて、いけてる Web 開発者、特にバックエンド開発者の方はオブザーバビリティという言葉は聞き及んでいるかと思います。 なかでもオブザーバビリティ三種の神器と言われている(?)ログ、メトリクス、分散トレーシングをどう実装するか頭を悩ませているかもしれません。 頭を悩ませてきた、あるいは頭を悩ませている理由の一つは、これらを実装するときに特定の実装向けになりがちであったためです。 メトリクスであれば最近は Prometheus 向けに /metrics エンドポイントとして提供する実装が多いといった話です。しかしながら、 あらゆる人が Promet

    OpenTelemetry 良い感じ - 誰かの役に立てばいいブログ