先日のTF Dev Summit 2018で発表されたTensorFlowの新機能に、TensorFlow Hubというのがあります。これはDockerでいえばDockerHubに該当するもので、モデルを簡単に共有できるエコシステムの一部です。本記事執筆時点(2018年4月)ではまだ一般ユーザーが独自のモデルをHubへアップロードすることはできませんが、現在多くの有用な学習済みモデルがGoogleから提供されています。 何の記事? 上記のTensorFlow HubをDataflowから使い、バッチでたくさんの画像の特徴量を抽出してみよう、というお話です。 Dataflowって何? Cloud DataflowとはGoogle Cloud Platformのプロダクトの1つで、いわゆるETLに該当します。サーバーレス環境なので、ほんの数十行のコードでオートスケールする大規模なデータ処理が可