[B! *algorithm][gcloud] sh19910711のブックマーク

sh19910711 id:sh19910711

*algorithmとgcloudに関するsh19910711のブックマーク (23)

機械学習パイプラインの要件と Vertex Pipelines / Kubeflow Pipelines V2 による実装
サンプルパイプライン : https://github.com/reproio/lab_sample_pipelines/tree/main/kfp 解説記事 : https://tech.repro.io/entry/2021/06/22/125113 ハンズオン資料 : https://gist…
sh19910711 2024/05/05
"MLOps: プラクティスに従うことではなく自分たちの問題解決が重要 + 自分たちが考えるMLOpsで良い / 機械学習システムはとにかく複雑 + デプロイを自動化するためにはCI/CDだけでは足りない + 継続的な学習も必要" 2021

*algorithm

機械学習

gcloud

workflow
リンク
【強化学習】クラウドサービスを利用した分散強化学習（GKE/有料編） - Qiita
この記事は自作している強化学習フレームワークの解説記事です。この記事のコード場所：examples/kubernetes 続きです。前回作成したk8s環境をGKEに作成します。 ※有料サービスを取り扱うので利用する場合は自己責任でお願いします 1：【強化学習】クラウドサービスを利用した分散強化学習（無料編） 2：【強化学習】クラウドサービスを利用した分散強化学習（kubernetes編） 3：ここ全体イメージ(GKE) 今回作成する構成の全体イメージは以下です。前回との違いは Trainer と Redis を同じPodに入れています。 Trainer と Queue は遅延をなるべく減らしたかったので同じ物理サーバにアサインされるように同じPodにいれました。 Google Kubernetes Engine (GKE) GKEはGoogle Cloud Platform(GCP
sh19910711 2024/03/17
"AtariではGPUが40%ぐらい常に使われていましたが、1000円いかないのは意外でした / もっと簡単にGPUの高性能サーバが使えると思ったのですが、結構アサイン失敗 / 学習回数は少なめ + 今回20万回 + DQN論文は5000万フレーム" 2023

*algorithm

機械学習

*infra

gcloud
リンク
BigQueryでサッと試す推薦アルゴリズム - Re:ゼロから始めるML生活
この記事は（1人で）基礎から学ぶ推薦システム Advent Calendar 2022の10日目の記事です。前回までで、推薦システムを考える上でのさわりの部分は確認できたと思うので、ちょっとずつ実務っぽい話にシフトしていこうと思います。実務で難しい推薦アルゴリズムを実装する前に、「チューニングとかはおいておいて、だいたいどれくらい効果が出るのかサッと試したい」という場面があったりします。腰を据えてしっかりアルゴリズムを調整するならPythonでGPUを使って一つずつ実験をして…といった試行を繰り返すことになるかと思いますが、「安い！早い！うまい！」みたいなのが求められる状況では、Pythonを使うよりお手軽にサッと実装できると嬉しかったりします。ということで、今回はSQLで推薦アルゴリズムを書いて、BQの計算能力でぶん殴るやりかたをやってみたいと思います。問題設計 Datase
sh19910711 2023/04/19
2022 / "LookerのtheLook eCommerceデータセット / おすすめメールを送った後に実際にその商品が購入されるか / 「そもそもBQ使ってるんだったらBigQueryML使えよ」ってツッコミが入りそう"

*data

*algorithm

search

gcloud

warehouse
リンク
BigQuery MLで商品一覧画面の並び順を改善して売上を40%上げた話 - OVERS
目次はじめに自己紹介内容概要基本設計 TCVのビジネスモデル施策内容システム構成フェーズ１: とりあえずAutoMLを使ってみるフェーズ２: 目的変数を変えるフェーズ３: BigQuery MLの導入による検証高速化フェーズ４: 国別フェーズ５: 回帰ではなく分類へフェーズ６とその先へおわりにはじめに自己紹介じげん開発Unit データ分析基盤チームの伊崎です。開発Unitは特定の事業部に所属しない全社横断組織です。その中で、データ分析基盤チームは全社のデータ基盤の整備、データ利活用を担当しています。私個人としては、大学で純粋数学を学んだ後、前職でエントリーレベルの機械学習エンジニアとして働きました。現職では半分データエンジニア、半分データサイエンティストとして働いています。プライベートでKaggleに参加し、銅メダルを獲得した経験があります（最近は活動
sh19910711 2022/12/01
"BigQuery MLの導入による検証高速化 / AutoMLは最終的なモデルを得るためのみに用い、そこまでの試行錯誤は普通のGBDTでやりたい / 最終的なモデル作成はBigQuery MLのAutoMLモデルを利用"

*algorithm

機械学習

*data

gcloud

warehouse
リンク
GPT-neoxの学習用にマルチノード並列学習環境を整えた with DeepSpeed - ABEJA Tech Blog
1. はじめに 2. 並列学習環境を調べる並列学習方法を調べるネットワーク、コンピューティング周りを調べる 3. インフラ環境を構築するコンパクトプレースメントポリシーの作成 Compute Engine を起動する (Fast Socket と gVNIC を利用する) 4. まずはシングルノードで動かす 5. 次はマルチ環境で動かす w/ Docker リポジトリをクローン ssh/config を作成 authorized_keys を作成 hostfile を作成 Docker を build 6. つまずいたポイント学習途中に出力したファイルを再利用するのでNFSが必要に NFSのリージョンを間違えて速度が出なかった大量のGPUの調達はリソースを確保できないかもしれないので要サポート確認コンパクトプレースメントポリシーは邪魔になりそうだった 7. 結果 8. まとめ
sh19910711 2022/10/02
GCPでやったのか👀 / "DeepSpeed が優秀過ぎてちょっと環境整えるだけ / GCP側もgVNICやFast Socket等のプリセット・環境が整備 / リージョンによっては A100 が無いリージョンがあったり、ゾーンによっても利用できる量が異なり"

*algorithm

機械学習

*infra

gcloud

gpu
リンク
Vertex AI AutoML で作成した機械学習モデルを Cloud Run にデプロイする - G-gen Tech Blog
G-gen の佐々木です。当記事では Google Cloud（旧称 GCP）の機械学習サービスである Vertex AI の AutoML で作成した機械学習モデルを、サーバーレスなコンテナ実行基盤である Cloud Run にデプロイしていきます。 Vertex AI および Cloud Run とは？ Vertex AI で作成したモデルのデプロイについて当記事で Cloud Run にデプロイするモデル Vertex AI Model Registry からモデルをエクスポートするローカルの Docker コンテナで予測を実行する Artifact Registry にモデルをアップロードする Cloud Run にモデルをデプロイする Cloud Run サービスに予測リクエストを送信する Vertex AI & Cloud Run Vertex AI および Cloud R
sh19910711 2022/08/27
"Google Cloud が提供する、 Vertex AI のモデルを実行するためのモデルサーバーのコンテナイメージを使用 / asia-docker.pkg.dev/vertex-ai/automl-tabular/prediction-server"

*algorithm

*infra

gcloud

container
リンク
13億パラメータの GPT モデルを GCP Cloud Run で動かす - Qiita
サーバレスプラットフォームである GCP Cloud Run で、Transf ormersのモデルを動かしてみました。 Transf ormersの汎用言語モデルを動作させるにはそれなりのスペックが必要になりますが、サーバレスと言うとメモリ等のリソースに厳しい制限があり大きなモデルを動かすようなことは難しい印象です。ですがCloud Runは結構メモリを積める1ので、実は普通に動かせてしまいます。環境 Docker version 20.10.11, build dea9396 Docker Compose version v2.2.1 Google Cloud SDK 383.0.1 Cloud Run 第1世代 GCPのサービス内容は2022年5月14日時点のものになっています。全体のソースコードは下記です。細かい依存関係などはこちらを参照してください。実装まずはCloud Ru
sh19910711 2022/05/15
Cloud Run + Streamlit + GPT / "大規模な言語モデルも簡単にサーバレスプラットフォーム上で動作させられるように / rinna/japanese-gpt-1b > cpu=4 + memory=11Gi / Transformersはオフラインモード + コンテナのビルド時にモデルをダウンロード"

*infra

gcloud

*algorithm

NLP
リンク
BigQuery MLでスロット使用量が急増しているプロジェクトやユーザーを異常検知する - yasuhisa's blog
背景どうやって異常を検知するか BigQuery MLでの異常検知検知できるモデルの種類共通設定データの前準備モデルの学習モデルを元にスロット使用量が異常に増加していないか予測する所感背景 BigQueryはオンデマンドとフラットレート(定額料金)があるオンデマンドはスキャン量がお金に直結するため、INFORMATION_SCHEMA.JOBS_BY_*などを使ってクエリ警察をしている方も多いはず INFORMATION_SCHEMAに代表されるデータ管理に役に立つ現場のノウハウを最近会社のTech Blogに書いたので、そちらも見てね一方で、フラットレートに関しては定額使いたい放題のプランであるため、オンデマンドよりはクエリ警察をしていない場合もある見れるなら見たいが、どうしても支出に直結するオンデマンドを優先して見てしまいがち。工数も限られているが、あまりに自由
sh19910711 2022/03/11
一瞬BQMLでスロット逼迫してる話かと思った / "SQLを書くだけで前処理から学習、予測までBigQueryが面倒を見てくれる / 異常検知のアラートを運用に乗せるためには、false positiveをなるべく減らすのをまず先に考える"

*data

gcloud

warehouse

*algorithm

機械学習
リンク
BQML blocksを使ってLookerでBQMLしましょう
sh19910711 2021/12/24
"BQMLのモデルを作るところや、予測等を動かすためのSQL(CREATE MODELやML PRDICT等)はすでにblocksで書かれている / BlocksのLookMLは独特な作りをしているので、初見だと取っ付きにくい印象"

*data

gcloud

warehouse

dashboard

*algorithm

機械学習
リンク
GKE Autopilotで作るMLリアルタイム推論基盤 | PLAID engineer blog
こんにちは！エンジニアの@tik-son, @ikemonnとMLエンジニアの@nichimuです。本日ついに待望のGKE Autopilotがリリースされましたね！この記事では、GKE Autopilot上で動いているリアルタイム推論基盤でなぜ我々がGKE Autopilotを利用することにしたのかについてお話しします。 MLリアルタイム推論基盤とはリアルタイム推論基盤とは、機械学習のモデルを使用して、リアルタイムに推論が行える基盤のことです。このリアルタイム推論基盤を用いることで、エンドユーザーがsession内で電話するかを予測するエンドユーザーが会員登録を行ったsession内で資料請求をするか予測するのように数秒-数分後にエンドユーザーがどんな状態であるかなどを予測することが実現可能になります。この基盤はまだ絶賛開発中で誰もが簡単に使える状態になっていないのですが
sh19910711 2021/04/24
"resourcesのlimitsとrequestsを記述するだけで、MLエンジニアが欲しいマシンリソースが簡単に用意でき、運用まで期待できる / リソースはCloudRunと異なり、動き続ける前提なのでPub/SubのPull型を簡単に扱うことができる"

*infra

gcloud

*algorithm

機械学習
リンク
Google Cloud AutoMLで動いているmodel searchを実際に動かしてみる
学習率や正則化、活性化関数、果てはアンサンブルまで試行してくれる Minori @ GDE MLです。 Google AIから少し前にGoogle Cloud Auto MLの中で動いているであろうmodel searchがOSSとして発表されました。記事は下記です。
sh19910711 2021/04/13
"Google Cloud AutoMLで動いているmodel searchを実際に動かしてみる"

*algorithm

機械学習

gcloud
リンク
Task Queue と Token Bucket アルゴリズム - addsict's blog
GAE の Task Queue (Push Queue) は Queue に入れられたタスクを全て一気に実行するのではなく、あらかじめ設定しておいた実行レートに従って、バックエンドの App Engine インスタンスにリクエストを投げてくれます。この実行レート制御のベースとなっているのが Token Bucket というアルゴリズムです。今回はその Token Bucket アルゴリズムと、Task Queue の設定値である bucket_size rate max_concurrent_requests にどのような関連性があるか、まとめてみたいと思います。 Token Bucket アルゴリズム Token Bucket はネットワークに流れるトラフィックを一定量以下になるように調整するアルゴリズムであり、Amazon EBS の IOPS のバースト制御や Amazon A
sh19910711 2021/01/02
"GAE の Task Queue (Push Queue) は Queue に入れられたタスクを全て一気に実行するのではなく、あらかじめ設定しておいた実行レートに従って、バックエンドの App Engine インスタンスにリクエストを投げてくれます"

*infra

*algorithm

gcloud
リンク
BQMLに新たに追加されたTRANSFORM句で、モデルの前処理を自動的に行う - Qiita
これなに? F81アドベントカレンダー二日目担当の長谷川です。 BQMLに新たに追加されたTRANSF ORM句についての解説します。2019/12/2時点で、まだ日本語の公式ドキュメントが存在しないことから、記事にしようと思いました。なお、現時点ではまだこの機能はBetaです。英語の公式ドキュメントは存在するので、興味があれば、こちらも参考することをお勧めします。今回の記事では、BigQuery(ML)の基本事項は一切説明しません。BQMLで使用できる関数などについては前記事を参照してください。 TRANSF ORM句とは? 行いたい前処理をモデル構築時に定義し、予測、評価時に自動的に実行するためにしようするSQLの句(clause)です。これにより、BQMLで作成するアルゴリズムとそれに伴う前処理を一体化させ、モデルを構築することができます。前処理をモデルの中に集約し、隠蔽できるので
sh19910711 2020/11/29
TRANSFORM句 / "元のデータを読み込ませるだけで自動的に前処理が実行されるので、予測のクエリがだいぶ簡略化できますね。また、モデルの評価のときも同様に前処理を省略できます"

*data

gcloud

warehouse

*algorithm

機械学習
リンク
Kerasを使ったGoogle VisionサービスのDistillation(蒸留) - にほんごのれんしゅう
Kerasを使ったGoogle VisionサービスのDistillation(蒸留) Vision APIをVGGで蒸留する Vision APIの出力は実はタグの値を予想する問題でしかない出力するベクトルが任意の次元に収まっており、値の範囲を持つ場合には、特定の活性化関数で近似できる例えば、Vision APIはメジャーなタグに限定すれば、5000個程度のタグの予想問題であり、5000個程度であればVGGを改良したモデルで近似できることを示す (2017/11/08　データセットをスクリーニングして、問題のあるデータセット（一定の確率で特定のタグによってしまう）を排除したところ、だいぶ改善しました) 理論去年の今頃、話題になっていたテクノロジーで、モデルのクローンが行えるとされているものである。 Google VISION APIなどの入出力がわかれば、特定のデータセットを用意す
sh19910711 2020/11/23
*algorithm

機械学習

gcloud
リンク
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
sh19910711 2020/09/09
*algorithm

機械学習

*data

gcloud

warehouse
リンク
BigQuery MLにAutoML Tables、XGBoost、DNN、ARIMAが来たのでおさらい - Qiita
はじめに日本時間2020-06-17のリリースで、BigQuery MLにAutoML Tables、XGBoost、DNNが来ました。release-notes#June_16_2020 おさらいに、BigQuery MLで何ができるか再整理します。追記: 日本時間2020-07-02のリリースで、BigQuery MLにARIMAも来ましたね。日本時間2020-06-28のリリースノートでエラーになってたのですが、リリース日がしれっと修正されてました。release-notes#July_01_2020 BigQuery MLでできること概要 BigQueryでStandard SQLを使って、機械学習モデルを訓練、推論できます。データの移動を意識する必要がないため、開発スピードを向上と同時に、モデルの民主化を実現できます。例えば、以下のようにして、1時間ほど待てば、AutoM
sh19910711 2020/06/17
*algorithm

機械学習

*infra

gcloud

warehouse

tree
リンク
BigQueryで傾向スコア分析｜Dentsu Digital Tech Blog｜note
電通デジタルで機械学習エンジニアをしている今井です。本記事では、BigQueryで傾向スコア分析を行うための方法について紹介します。広告効果ってあったの？広告効果とは、広告に接触した場合と接触していない場合とのその後のコンバージョン（例えば、購入金額や継続期間など）の差である、と言えます。しかしながら、同一ユーザーにおいて、広告に接触した場合と接触していない場合とを同時に観測することはできません。これを反実仮想（counterfactual）と呼びます。そこで提案されたのが平均処置効果（average treatment effect, ATE）です。広告に接触したユーザー群（𝑤=1）と接触していないユーザー群（𝑤=0）とのその後のコンバージョン（𝑦 ）の差を広告効果とするものです。ここで、介入（広告に接触する）の有無以外の条件が公平になるようにユーザー郡が分かれていれ
sh19910711 2020/05/19
*data

gcloud

warehouse

統計

#

*algorithm

機械学習
リンク
GCP AutoML Vision で鍵かけ忘れを防ぐ仕組みを作る - kurainの壺
slack にカギの開閉が通知される様子玄関ドアのカギが開いた時、閉じたときに slack に通知が来る仕組みを作りました。今のところうまく運用できていて、外出後にカギが不安になって玄関まで戻ってくることがなくなりQoLがあがった感があります。この仕組はドアの画像から閉じたサムターンを検出することで実現しています。Raspbeery Pi 3 で毎秒1画像くらいの処理ができるので、カギの通知としては問題ないレイテンシーです。物体識別を可視化してみる肝となる画像認識部分は GCP の AutoML Vision で学習させています。画像10枚で実用的な精度が出るDNNモデルが取得できる手軽さはなかなかすごいものがあります。もちろんこんな簡単な画像認識なら、OpenCV を使ってテンプレートマッチングでも良いのでは? と思う向きもあるでしょう。実際その手法も試していて、頑張ってチュー
sh19910711 2019/10/27
*algorithm

機械学習

gcloud
リンク
Cloud Auto MLの使用感 - wakame
Cloud AutoML は機械学習プロダクトのスイートです。AutoML を利用すると、機械学習の専門知識があまりない開発者でも Google の最先端の転移学習とニューラルアーキテクチャ検索技術を利用して、ビジネスニーズに合った高品質のモデルをトレーニングできます。
sh19910711 2019/05/19
"ノンプログラミングとか言ったけどデータセット大量になったら準備する部分はプログラミング必要だよね"

*algorithm

機械学習

*infra

gcloud
リンク
KaggleのHousePredictionを題材にしてAutoML Tablesがどんなもんか見てみる - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? TL;DR AutoML TableがGoogle Cloud Next'19で発表されたよもう触れるみたいなので、KaggleのHousePricePredictionで試してみたよ、手軽だったよ一応LightGBMと比較してみたら、チューニングすれば良い成績を出せたよ前置き Google Cloud Next'19でAutoMl Tableが発表されましたね〜 automl-tables LPがいつもすこ早速使えるようなので(現在はβ版)、使ってみました。題材はKaggleから取ってきます。 Titanicでやろうとしてみた
sh19910711 2019/05/15
*infra

gcloud

*algorithm

機械学習

contest
リンク
1 2 次のページ