データ基盤移行計画とPySpark（Spark Connect）の検証 - MicroAd Developers Blog

テクノロジーカテゴリーの変更を依頼記事元:

developers.microad.co.jp

4users がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

データ基盤移行計画とPySpark（Spark Connect）の検証 - MicroAd Developers Blog

マイクロアドでサーバサイドエンジニアをしているタカギです。今回はデータ基盤移行とPySparkについて... マイクロアドでサーバサイドエンジニアをしているタカギです。今回はデータ基盤移行とPySparkについての話になります。目次目次データ基盤移行の概要データ基盤移行後のバッチ処理 Spark Connectを導入する Spark Connectの問題点まとめ補足データ基盤移行の概要諸々の事情1により、データ基盤をHadoopから移行することになりました。現在のデータ基盤でのETL/ELT処理はHadoopエコシステム(Hive、HDFSなど)を中心に構成されています。 ※Hadoopについてはこちらの記事が参考になります。これらをKubernetes、PySpark、S3互換ストレージ（詳細未確定）を組み合わせたデータ基盤へ移行する計画です。すぐにすべてを移行するのは難しく、完全移行までは新旧並行稼働がそれなりの期間続く予定です。今回の記事では、PySparkを使用し

ブックマークしたユーザー

k_osawa2023/08/22

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx