[B! MLOps] masaki925_8107のブックマーク

[Tech Blog] Vertex Pipelines (Kubeflow) for Machine Learning Model Training Pipeline

masaki925_8107 2022/07/14

MLOps

リンク

AIシステムが成熟する今「MLOps」が必要とされる理由とは？ MLOpsを推進するために大切なこと

近年、機械学習（ML）やディープラーニング（DL）といったAI関連技術をプロダクトへ応用し、新たな価値を生みだそうという動きが加速しています。その中で、従来の「DevOps」の考え方を、機械学習向けに発展させた「MLOps」という新しい概念が生まれ、注目を浴びています。MLOpsが注目される背景には、どのような課題があるのか。そして、実際に現場でMLOpsに携わる人々は、何を目指し、どんな取り組みを行っているのか。ヤフーとLaunchableで、それぞれMLOpsをリードしている2人のエンジニアに語っていただきました。機械学習システムの普及を契機に関心が高まる「MLOps」黒松：ヤフーの黒松です。私は大学時代に、ビッグデータを研究テーマにしており、OSSとして当時注目されていたHadoopなどを扱っていました。卒業後は富士通研究所に入り、基盤研究の一環として、機械学習のための基盤を作り

masaki925_8107 2022/06/16

MLOps

リンク

https://gradientflow.com/machine-learning-trends-you-need-to-know?s=09

masaki925_8107 2022/06/06

MLプロダクトを作るときのチェックリスト、指標が大事そう

リンク

DTU-MLOps

masaki925_8107 2022/01/11

MLOps

リンク

Kubeflow Pipeline の魅力を最大限に引き出すにはやっぱりコンポーネント化スキルが必要 - スタディサプリ Product Team Blog

こんにちは、データチームの@masaki925 です。昨年末にMLOps に関する記事を書きました。 quipper.hatena blog.com 今回はその続編で、レコメンドシステムのJenkins 部分をAI Platform Pipeline (以下AIP Pipeline) に置き換えた話です。昨今では国内でもKubeflow Pipeline (以下KFP) 系の導入事例がいくつか出ており、特にZOZOテクノロジーズさんの記事は大変参考にさせていただきました。 tech blog.zozo.com 今回の話では、まだまだパイプラインを使いこなすところまでは至っていないですが、最初に導入するにあたっての迷いどころや躓きどころ、反省点など、1事例として紹介できればと思います。想定読者は、前回同様MLOps 初心者向けとなります。これからMLOps をやっていきたい方 ML ワ

masaki925_8107 2021/06/17

パイプラインである必要がないパイプラインを作った話を書きました

リンク

TensorFlow Data Validation によるトレーニング / サービングスキューの分析 | Cloud アーキテクチャセンター | Google Cloud

デジタルトランスフォーメーションを加速お客様がデジタルトランスフォーメーションに乗り出したばかりでも、あるいはすでに進めている場合でも、Google Cloud は困難な課題の解決を支援します。

masaki925_8107 2021/04/28

MLOps
TFDV

リンク

How Optimizing MLOps Can Revolutionize Enterprise AI

How to Use Multiple GitHub Accounts Git is a popular tool for version control in software development. It is not uncommon to use multiple Git accounts. Correctly configuring and switching Git accounts is challenging. In this article, we show what Git provides for account configuration, its limitations, and the solution to switch accounts automatically based on a project parent directory location.

masaki925_8107 2021/03/07

MLOps

リンク

サイエンティストとエンジニアでつくるML ワークフロー - スタディサプリ Product Team Blog

こんにちは、データエンジニアの@masaki925 です。この記事はMLOps Advent Calendar 2020 の19 日目の記事です。 MLOps には、その成熟度に応じて3つのレベルがあると言われています。 MLOps レベル 0: 手動プロセス MLOps レベル 1: ML パイプラインの自動化 MLOps レベル 2: CI / CD パイプラインの自動化私の所属するチームでは現在ここのレベルを上げるべく取り組んでいますが、その中でデータサイエンティスト(以下、DS) とデータエンジニア(以下、Dev) の協業って難しいよな〜と思う事例があったので紹介したいと思います。想定読者は以下のような方です。これからMLOps を始めようとしている方既存プロジェクトがあり、ML 等を使ってエンハンスしていきたいと考えている方異文化協業に興味がある方 ML ワークフロー

masaki925_8107 2020/12/19

書きました

MLOps

リンク

Effective testing for machine learning systems.

Working as a core maintainer for PyTorch Lightning, I've grown a strong appreciation for the value of tests in software development. As I've been spinning up a new project at work, I've been spending a fair amount of time thinking about how we should test machine learning systems. A couple weeks ago, one of my coworkers sent me a fascinating paper on the topic which inspired me to dig in, collect

masaki925_8107 2020/09/29

Model evaluation とModel tests を分けて、tests の中にはpre-train とpost-train がある、というデザイン。参考になる。

リンク

ハイパラ管理のすすめ -ハイパーパラメータをHydra+MLflowで管理しよう- - やむやむもやむなし

機械学習をやっている人なら誰もが遭遇したであろうこの光景 (※写真はPyTorchのLanguage ModelのExampleより) Pythonのargparseでシェルから引数を受け取りPythonスクリプト内でパラメータに設定するパターンは、記述が長くなりがちな上、どのパラメータがmodel/preprocess/optimizerのものなのか区別がつきにくく見通しが悪いといった課題があります。私は実験用のパラメータ類は全てYAMLに記述して管理しています。 YAMLで記述することでパラメータを階層立てて構造的に記述することができ、パラメータの見通しがぐっとよくなります。 preprocess: min_df: 3 max_df: 1 replace_pattern: \d+ model: hidden_size: 256 dropout: 0.1 optimizer: algo

masaki925_8107 2020/07/29

MLOps
hydra

リンク

小さく始めて大きく育てるMLOps2020 | | AI tech studio

AI Labの岩崎(@chck)です、こんにちは。今日は実験管理、広義ではMLOpsの話をしたいと思います。 MLOpsはもともとDevOpsの派生として生まれた言葉ですが、本稿では本番運用を見据えた機械学習ライフサイクル（実験ログやワークフロー）の管理を指します。 https://www.slideshare.net/databricks/mlflow-infrastructure-for-a-complete-machine-learning-life-cycle 参考記事のJan Teichmann氏の言葉を借りると、エンジニアがDevOpsによって健全で継続的な開発・運用を実現している一方、多くのデータサイエンティストは、ローカルでの作業と本番環境に大きなギャップを抱えているクラウド含む本番環境でのモデルのホスティングが考慮されないローカルでの作業本番のデータボリュームやス

masaki925_8107 2020/07/29

知らないのばっか。よいまとめ

MLOps
tools

リンク

機械学習アプリケーションにおけるテストについて - Re:ゼロから始めるML生活

機械学習系の話題が多い昨今ですが、実際触ってみると期待した精度・結果が出ないなんてことはよくあることではないでしょうか。機械学習特有の性質として、データ自体がモデルを変化させ、結果として業務に影響を与えたりします。仮に、機械学習屋さんが精度が出るモデルを構築したと言っても、それを導入するときに、システム全体での品質の維持に苦労したりします。ということで、不確実性の大きい機械学習系開発についての、設計・テスト戦略でどうやってリスクを低減していけるかが一つカギになってくると思い、方法論について勉強しましたので、そのメモです。非常に参考にしたのはこちら。 arxiv.org テストそのもののテクニックなどは、一般的なテスト駆動開発に関する書籍を合わせてをご参考ください。テスト駆動開発作者:Kent Beck発売日: 2017/10/14メディア: 単行本（ソフトカバー）テスト駆動P

masaki925_8107 2020/04/19

めちゃくちゃ価値のある体系化だ。これらを網羅実践できてるとこあんまり無さそう。アドテク界隈はここらへん先行してそうだけどどの程度現実的な実装に落とし込めてるのか気になる (ﾁﾗｯ

リンク

MLOps - 機械学習モデルの活用、その先にあるチャレンジ Part 1

プラットフォームの概要 AI Platform 生成 AIおよび予測 AIのプラットフォームもっと詳しくドキュメント新機能ログイン無料で始める運用自信を持ってAIを拡張し、比類のないエンタープライズ・モニタリングとコントロールでビジネス価値を促進デプロイと実行再学習と最適化監視と介入ガバナンス AIの環境、チーム、およびワークフローを統合し、大規模な範囲での完全な可視性と監視を実現レジストリと管理監査と承認コンプライアンスドキュメント生成構築ニーズの進化に合わせて自由に適応できるオープンなAIエコシステムで、迅速なイノベーションを実現分析と変換学習とチューニング組立てと比較プラットフォーム統合インフラストラクチャーへのデプロイソリューション業界ごとヘルスケア製造小売業金融サービス成果ごとユースケースのライブラリーお客様事例 Dat

masaki925_8107 2020/01/16

総合格闘技感ある

MLOps

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

MLOpsに関するmasaki925_8107のブックマーク (13)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス