タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*algorithmとNLPとgcloudに関するsh19910711のブックマーク (1)

  • 13億パラメータの GPT モデルを GCP Cloud Run で動かす - Qiita

    サーバレスプラットフォームである GCP Cloud Run で、Transformersのモデルを動かしてみました。 Transformersの汎用言語モデルを動作させるにはそれなりのスペックが必要になりますが、サーバレスと言うとメモリ等のリソースに厳しい制限があり大きなモデルを動かすようなことは難しい印象です。ですがCloud Runは結構メモリを積める1ので、実は普通に動かせてしまいます。 環境 Docker version 20.10.11, build dea9396 Docker Compose version v2.2.1 Google Cloud SDK 383.0.1 Cloud Run 第1世代 GCPのサービス内容は2022年5月14日時点のものになっています。 全体のソースコードは下記です。細かい依存関係などはこちらを参照してください。 実装 まずはCloud Ru

    13億パラメータの GPT モデルを GCP Cloud Run で動かす - Qiita
    sh19910711
    sh19910711 2022/05/15
    Cloud Run + Streamlit + GPT / "大規模な言語モデルも簡単にサーバレスプラットフォーム上で動作させられるように / rinna/japanese-gpt-1b > cpu=4 + memory=11Gi / Transformersはオフラインモード + コンテナのビルド時にモデルをダウンロード"
  • 1