エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【Python】Apache Beamを使ってデータパイプラインを実装してみる - St_Hakky’s blog
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【Python】Apache Beamを使ってデータパイプラインを実装してみる - St_Hakky’s blog
こんにちは。 先日、Apache Beamに関する概要の記事を書きました。 www.st-hakky-blog.com 今回は、Apac... こんにちは。 先日、Apache Beamに関する概要の記事を書きました。 www.st-hakky-blog.com 今回は、Apache Beam SDKのうち、Pythonを使って、実際にデータパイプラインを実装してみようと思います*1。 今回のお題 今回は、Apache Beamの公式のドキュメントをベースにやっていこうと思います Beam Programming Guide Beam Overview Runnerとしては、今回はとりあえず動かして、プログラミングの仕方の雰囲気をつかむことを主眼にするため、ローカル環境を使っていきます。 Apache Beam SDKのインストール 普通にpipでインストールすることができます。RunnerとしてDataflowも使用する場合は、それも合わせて追加します*2。 $ pip install apache-beam $ pip ins