タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

apacheとbeamに関するatsuizoのブックマーク (1)

  • PythonでApache beam 入門

    2020-12-26 TensorFlowの勉強をしていたら、Apache beam を前処理に採用していたケースがあり、興味を持ったので深堀りしてみます。 興味が湧いたモチベーションとしては、 データ量が増加しても前処理部分を難なくスケールできそう(前処理部分をスケールさせて高速に実験を回したい、並列化などはすべて良い感じにbeamに任せれそうバッチとストリーミングの両者に対応可能なので、柔軟な機械学習の推論サービスが提供できるのでは? (GCPの参考資料 Data preprocessing for machine learning: options and recommendations)Apache beam を触りつつ分散データ処理を学びたいhttps://github.com/jhuangtw/xg2xg#services を見てみるとGoogle 内部のFlume という並列

    PythonでApache beam 入門
    atsuizo
    atsuizo 2020/12/26
    ちょうど興味を持ち始めてGCPのDataflowがBeamの実行環境という認識をしたところ。続編期待。
  • 1