並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 144件

新着順 人気順

mlflowの検索結果1 - 40 件 / 144件

  • ハイパラ管理のすすめ -ハイパーパラメータをHydra+MLflowで管理しよう- - やむやむもやむなし

    機械学習をやっている人なら誰もが遭遇したであろうこの光景 (※写真はPyTorchのLanguage ModelのExampleより) Pythonのargparseでシェルから引数を受け取りPythonスクリプト内でパラメータに設定するパターンは、記述が長くなりがちな上、どのパラメータがmodel/preprocess/optimizerのものなのか区別がつきにくく見通しが悪いといった課題があります。 私は実験用のパラメータ類は全てYAMLに記述して管理しています。 YAMLで記述することでパラメータを階層立てて構造的に記述することができ、パラメータの見通しがぐっとよくなります。 preprocess: min_df: 3 max_df: 1 replace_pattern: \d+ model: hidden_size: 256 dropout: 0.1 optimizer: algo

      ハイパラ管理のすすめ -ハイパーパラメータをHydra+MLflowで管理しよう- - やむやむもやむなし
    • KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ - GMOインターネットグループ グループ研究開発本部

      2020.10.05 KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ こんにちは。次世代システム研究室のY. O.です。 筆者はデータ分析のスキルアップのためにkaggleというデータ分析プラットフォームを活用しています。kaggleを始めてから約2年間を経て、スキルアップの枠を超え、趣味・生活の一部・etc.になってきてしまっているのも認めざるを得ません。。。 今回は、先日kaggleの自然言語処理コンペ(Tweet Sentiment Extraction)で2位になった結果を題材に、振り返りの意味を込めて”こうしておけば良かった”という点をMLOpsの観点でまとめていきたいと思います。 ここで、kaggleを取り巻くMLOpsの構成をKaggleOpsと勝手に呼ぶこととし、少なくとも筆者は今後のコンペでも以下にまとめ

        KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ - GMOインターネットグループ グループ研究開発本部
      • MLflowの使い方 - 機械学習初心者にもできる実験記録の管理 - - DATAFLUCT Tech Blog

        こんにちは!nakamura(@naka957)です。今回はMLflowをご紹介します。 読者の皆さんは、機械学習モデルのハイパーパラメータ調整を手作業で管理し、苦労した経験がないでしょうか。実験記録の管理は大事な一方で、なかなか大変です。 今回紹介するMLflowは、実験記録を簡単に管理できる便利なPythonライブラリです。MLflowは実験管理だけでなく、機械学習プロジェクト全体を管理する様々な機能を提供する非常に人気なライブラリです。一方で、多機能な反面で初心者が最初に導入するにはハードルが高い側面があるのも事実です。 本記事では、MLflowの実験管理の機能に絞り、簡単な例で使い方をご説明します。そのため、初めて使用する方も安心してご覧ください。 では、早速始めていきます。 実験記録の重要性 MLflowとは MLflowのインストール データセット準備 機械学習モデルの用意 M

          MLflowの使い方 - 機械学習初心者にもできる実験記録の管理 - - DATAFLUCT Tech Blog
        • 機械学習の煩雑なパラメーター管理の決定版 「Hydra」「MLflow」「Optuna」の組み合わせで手軽にはじめる一元管理

          Optuna™は、オープンソースのハイパーパラメーター自動最適化フレームワークです。 「Optuna Meetup #1」では、Optunaのユーザー、導入を検討している方、また開発者を中心に、Optunaの様々な活用方法が共有されました。中村氏は、Hydra・MLflow・Optunaを組み合わせたハイパーパラメーター管理について発表しました。 ふだんは音声合成と声質変換技術などの音声を用いる技術を研究 中村泰貴氏(以下、中村):「HydraとMLflowとOptunaの組み合わせで手軽に始めるハイパーパラメータ管理」というタイトルで、東京大学大学院情報理工学系研究科の修士課程2年の中村が発表します。 軽く自己紹介ですが、先ほど述べたように情報理工学系研究科の、猿渡・小山研究室の修士課程2年です。音声合成に関する技術をふだん研究しています。「Twitter」をやっているので、ぜひフォロー

            機械学習の煩雑なパラメーター管理の決定版 「Hydra」「MLflow」「Optuna」の組み合わせで手軽にはじめる一元管理
          • MLflowをさくっと導入できるdocker-composeを作った - やむやむもやむなし

            tl;dr docker-composeを叩くだけでさくっと認証付きのMLflowサーバーを立てられるようにしました こちらからどうぞ: ymym3412/mlflow-docker-compose みなさん機械学習の実験をしていますか? 学習に使ったハイパーパラメーターやデータ、Train/Valデータのロス、、Testデータでの各種評価指標、これらを人手で管理しておくのは非常に大変です。 モデルの開発や比較実験に集中していると「あれ、この最高精度のモデルはどんな条件で実験したものだっけ...」となることもあり、再現性が失われてしまうことにもつながります。 この機械学習にまつわる課題を解決するひとつの枠組みが実験管理と呼ばれるもので、学習時に使用したハイパーパラメーターやTrain Loss、Test データでの評価結果などを記録して管理しておくものです。 代表的なものでいうとMLflo

              MLflowをさくっと導入できるdocker-composeを作った - やむやむもやむなし
            • MLflow 〜これで機械学習のモデル管理から API 作成まで楽にできるかも〜 - Qiita

              ※下記に 1.0.0 版の記事書きました MLflow 1.0 リリース!機械学習ライフサイクルを始めよう! - Qiita はじめに 機械学習をサービスとして運用するには以下のステップが必要となるのではないでしょうか。 (ちなみに仕事できかいがくしゅうしたことないので下記の 99 割は根拠無いです ) 要件定義 目的や目標値の確認 「機械学習のスコアが高い」と「要件を満たす」は等価じゃないことに注意 どう提供するのか 入力値がわかりきっているなら、夜間バッチで全通り予測するとか とはいえ大抵分からないから随時入力を受け取ったら予測するようにしたいのです API としてアプリケーションサーバーから呼ぶ ← 今回想定していること データの分析 EDA(探索的データ分析)ともいう 困ったら最低下記だけでもやれば良い気がしてます 【Pythonメモ】pandas-profilingが探索的データ

                MLflow 〜これで機械学習のモデル管理から API 作成まで楽にできるかも〜 - Qiita
              • MLflow 1.0.0 リリース!機械学習ライフサイクルを始めよう! - Qiita

                以前 Qiita で MLflow(ver0.4) に関する記事を書いたのですが、 最近(2019年5月22日)MLflow 1.0(候補版)がリリースされたらしいので再びまとめてみました。 本記事では MLflow の概要に加え MLflow1.0 + PyTorch を使ったコードを扱います。 MLflow 1.0 Released! | MLflow Release MLflow 1.0.0 · mlflow/mlflow | github 0. 対象 機械学習アルゴリズム周りに関わっている人 頻繁に実験を回す人 機械学習を使ったちょっと長い期間のプロジェクトに所属してる人 パラメータとか諸々の管理に疲れてきた人 これから長期PoC案件にとりかかる人 混沌とした機械学習周りのなにかを引き継いでしまって悲しくなった人 1. MLflow とは ※ 図は公式サイトより引用 An open

                  MLflow 1.0.0 リリース!機械学習ライフサイクルを始めよう! - Qiita
                • オープンソースの機械学習プラットフォーム「MLflow」、Linux Foundationプロジェクトに加入

                  今回の、MLflowのLinux Foundationプロジェクトへの加入にともない、Linux Foundationは同プラットフォームの採用とコントリビューションをさらに拡大すべく、オープンガバナンスモデルを備えたベンダーニュートラルな拠点を提供する。 MLflowは、機械学習モデルの複雑なプロセスに対応するために開発されており、実験の追跡、再現可能な実行用のコードパッケージ化、モデルの共有、協力を含むデータの準備から本番環境へのデプロイメントまで、エンドツーエンドの機械学習開発ライフサイクルを管理するためのプラットフォームを提供することで、従来は困難だったモデルの構築、トレーニング、チューニング、デプロイ、管理といったプロセスがオーバーフローすることを防いでいる。 6月22日~26日(現地時間)にバーチャルで開催された「Spark + AI Summit」では、スターバックス、エクソ

                    オープンソースの機械学習プラットフォーム「MLflow」、Linux Foundationプロジェクトに加入
                  • MLflow - A platform for the machine learning lifecycle

                    Latest Blog Posts MLflow Docs Overhaul The MLflow Documentation is getting an upgrade. Simplifying the LLM journey: From crafting and evaluation to deployment Works with any ML library, language & existing code Runs the same way in any cloud Designed to scale from 1 user to large orgs Scales to big data with Apache Spark™ MLflow is an open source platform to manage the ML lifecycle, including expe

                    • MLflowで実験管理入門 | フューチャー技術ブログ

                      はじめにこんにちは、Strategic AI Group(SAIG)の山野です。 今回は、機械学習の実験管理をテーマにMLflowについて紹介します。 1. 実験管理の必要性モデル開発では、様々な条件で大量の実験を時には複数人で回していくことがありますが、徐々に管理し切れなくなり、後から(必要に迫られて)もう一度その実験を再現しようと思ってもできなくて困る、ということがあります。 つまり、実験が終わって数ヶ月後に「あの実験てどういう条件で実施してどういう結果出たんだっけ?+再現できる?」と聞かれても困らない状態を作れれば良いです。PoCが終わってプロダクション化のフェーズで、PoCの実験について確認されるケースが意外とあったりします。 管理すべき情報は、前処理・学習・評価それぞれで以下があります。 前処理 元データ <-> 前処理コード <-> 加工済データ 学習 加工済みデータ(学習用)

                        MLflowで実験管理入門 | フューチャー技術ブログ
                      • PyCaretとMLflowで機械学習の実験...

                        こんにちは!nakamura(@naka957)です。 今回は様々な機械学習アルゴリズムの比較・モデル実装に加えて、行った実験記録の管理を簡単に行う方法をご紹介します。実施事項がたくさんありますが、PyCaretとMLflowの活用で少ないコード行数で簡単に実施できます。 PyCaretは機械学習モデルの実装を簡単に行えるOSSですが、PyCaretからMLflowを呼び出すこともでき、実験記録の管理も同時に行えます。PyCaretとMLflowについては、DATA Campusにも紹介記事があります。是非、参考にしてみてください。 【PyCaret】 ■ AutoMLライブラリPyCaretを使ってみた〜モデル実装から予測まで〜 ■【続き】 AutoMLライブラリPyCaretを使ってみた 〜結果の描画〜 【MLflow】 ■ MLflowの使い方 - 機械学習初心者にもできる実験記録の

                          PyCaretとMLflowで機械学習の実験...
                        • 【MLOps】「いつか使いたい!」と思っていた人のためのMLflowまとめ - Qiita

                          MLflowとは? MLflowは機械学習のライフサイクル管理(MLOps)を目的としたライブラリで、主に実験管理用途で使用されることの多いツールです。 実験管理とは、 ・使用した学習器や学習データ、ハイパーパラメータ等のモデル作成条件 ・そのモデルを評価して得られた評価指標 のセットを記録し、複数条件の比較を行うことで最適なモデル選定を行う工程です。 このような条件記録はExcel等での手入力が一般的かと思いますが、 「手入力は時間が掛かる!」 「手入力をミスして苦労して集めた結果が信頼できなくなった」 という経験をされた方も多いかと思います 上記のような経験から、MLflowにより実験管理を自動化すれば、多くのメリットが得られることはイメージが付くかと思います。 MLflowは2018年リリースの比較的新しいライブラリですが、GitHubのStarは既に1万を突破しており、下図のように

                            【MLOps】「いつか使いたい!」と思っていた人のためのMLflowまとめ - Qiita
                          • MLflowのXGBoost拡張を読んでみる - 株式会社ホクソエムのブログ

                            はじめに ホクソエムサポーターの藤岡です。会社を移りましたが、相変わらずPythonを書く仕事をしています。 前回の記事に引き続き、今回もMLflowについての記事です。 前回はトラッキング寄りでしたが、今回はモデルのデプロイにも関わってくる内容です。 MLflowはXGBoost, PySpark, scikit-learnといった多様なライブラリに対応していて、様々な機械学習タスクに活用することができるのが売りの一つです。 その実現のため、設計や実装に様々な工夫がされているのですが、 この部分について詳しくなることで、オリジナルの機械学習モデルをMLflowとうまく繋ぐことができるようになったり ETLのようなモデル学習にとどまらない使い方もできるようになったりします。 本記事では、XGBoostをMLflowで扱うためのモジュール mlflow.xgboost について解説することで

                              MLflowのXGBoost拡張を読んでみる - 株式会社ホクソエムのブログ
                            • MLflowによる機械学習モデルのライフサイクルの管理

                              2020/6/11 画像センシングシンポジウム オーガナイズドセッション2 「限られたデータからの深層学習」 https://confit.atlas.jp/guide/event/ssii2020/static/organized#OS2 での招待講演資料です。 コンピュータビジョン分野を中心とした転移学習についての講演です。 パブリックなデータセットも増えていて、物体検出や領域分割などの研究も盛んですが、実際に社会実装しようとするときのデータは学習データと異なる性質(異なるドメイン)のデータである場合も非常に多いです。 本講演では、そのような場合に有効なドメイン適応の原理となるアプローチ2つと応用としての物体検出と領域分割の事例を紹介しています。

                                MLflowによる機械学習モデルのライフサイクルの管理
                              • Introducing the MLflow Model Registry--Machine Learning Model Hub

                                Unified governance for all data, analytics and AI assets

                                  Introducing the MLflow Model Registry--Machine Learning Model Hub
                                • The Linux Foundation、機械学習向けプラットフォーム「MLflow」をプロジェクトに追加

                                  The Linux Foundation、機械学習向けプラットフォーム「MLflow」をプロジェクトに追加:「機械学習のベストプラクティスを組み込む」 The Linux Foundationは「MLflow」を新たにLinux Foundationプロジェクトに加えた。MLflowは、Databricksが開発した、特定の機械学習フレームワークや言語に依存しない機械学習向けプラットフォーム。機械学習の開発ライフサイクルを管理する。

                                    The Linux Foundation、機械学習向けプラットフォーム「MLflow」をプロジェクトに追加
                                  • 機械学習で生じる問題を解決するPythonライブラリ「MLflow」

                                    2018年6月に開催された「Spark Summit」で、Databricksは「MLflow」という新たなプロジェクトを発表した。Databricksはオープンソースの「Apache Spark」によるクラウドベースのビッグデータ処理に重点を置く企業で、同社のMLflowは機械学習(ML)のためのPythonライブラリだ。 同社のチーフテクノロジストを務めるマテイ・ザハリア氏によると、同氏が率いるチームは、MLに関してよく耳にする問題に対処するアプローチを構築したという。 MLの典型的な課題 データの準備からモデルのトレーニングまで、MLのライフサイクルの「フェーズ」には多種多様なツールがある。 「各フェーズでチームがツールを1つ選ぶ従来のソフトウェア開発とは異なり、MLでは結果が改善するかどうかを確認するため、利用可能な全てのツール(アルゴリズムなど)を試してみる。そのため、MLの開発

                                      機械学習で生じる問題を解決するPythonライブラリ「MLflow」
                                    • MLflowのデータストアを覗いてみる - 株式会社ホクソエムのブログ

                                      (2020/08/14 flavorについての記載を一部修正) はじめに こんにちは、ホクソエムサポーターの藤岡です。 最近、MLflowを分析業務で使用しているのですが、お手軽に機械学習のモデルや結果が管理できて重宝しています。 また、特定のライブラリに依存しないなど、使い方の自由度も非常に高いところが魅力的です。 ただ、ザ・分析用のPythonライブラリという感じでとにかく色々なものが隠蔽されており、 サーバにつなぐクライアントさえもプログラマあまりは意識する必要がないという徹底っぷりです。 もちろんマニュアル通りに使う分には問題ないですが、 ちゃんと中身を知っておくと自由度の高さも相まって色々と応用が効くようになり、 様々なシチュエーションで最適な使い方をすることができるようになります。 というわけで、今回はMLflowの記録部分を担う、 Experiment, Run, Artif

                                        MLflowのデータストアを覗いてみる - 株式会社ホクソエムのブログ
                                      • Introducing MLflow: an Open Source Machine Learning Platform

                                        Unified governance for all data, analytics and AI assets

                                          Introducing MLflow: an Open Source Machine Learning Platform
                                        • hydra-mlflow-optuna

                                          スクラムガイドのスプリントレトロスペクティブを改めて読みかえしてみた / Re-reading the Sprint Retrospective Section in the Scrum Guide

                                            hydra-mlflow-optuna
                                          • Python: MLflow Tracking を使ってみる - CUBE SUGAR CONTAINER

                                            MLflow は MLOps に関連した OSS のひとつ。 いくつかのコンポーネントに分かれていて、それぞれを必要に応じて独立して使うことができる。 今回は、その中でも実験の管理と可視化を司る MLflow Tracking を試してみることにした。 機械学習のプロジェクトでは試行錯誤することが多い。 その際には、パラメータやモデルの構成などを変えながら何度も実験を繰り返すことになる。 すると、回数が増えるごとに使ったパラメータや得られた結果、モデルなどの管理が煩雑になってくる。 MLflow Tracking を使うことで、その煩雑さが軽減できる可能性がある。 使った環境は次のとおり。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.14.6 BuildVersion: 18G5033 $ python -V Python 3.7.

                                              Python: MLflow Tracking を使ってみる - CUBE SUGAR CONTAINER
                                            • MLFlow Trackingを使って、実験管理を効率化する - のんびりしているエンジニアの日記

                                              皆さんこんにちは お元気でしょうか。COVIT-19起因で引きこもっているため、少しずつ自炊スキルが伸びていっています。 以前、実験管理に関していくつかのソフトウェアを紹介しました。 その中で、MLFlow Trackingが一番良さそうではあったのでパイプラインに取り込むことを考えています。 もう少し深ぼって利用方法を把握する必要があったので、メモ代わりに残しています。 nonbiri-tereka.hatenablog.com MLFlow Trackingのおさらい MLFlowとは MLFlowはプラットフォームです。機械学習のデプロイやトラッキング、実装のパッケージングやデプロイなど幅広くサポートしています。 その中ではいくつかの機能があり、主にMLflow Trackingを実験管理に利用している人が増えています。 Trackingの機能については申し分がなさそうで、リモートサ

                                                MLFlow Trackingを使って、実験管理を効率化する - のんびりしているエンジニアの日記
                                              • 5 Tips for MLflow Experiment Tracking

                                                This article is about MLflow — an open-source MLOps tool. If you’ve never heard of it, here’s a tutorial. I am focusing on MLflow Tracking —functionality that allows logging and viewing parameters, metrics, and artifacts (files) for each of your model/experiment. When you log the models you experiment with, you can then summarize and analyze your runs within the MLflow UI (and beyond). You can und

                                                  5 Tips for MLflow Experiment Tracking
                                                • Hydra, MLflow, Optunaの組み合わせで手軽に始めるハイパーパラメータ管理

                                                  機械学習で用いるハイパーパラメータ管理には,主に二つの方法が考えられる. argparseを用いてコマンドラインからハイパーパラメータを設定 設定ファイルを用いた管理ありがちなハイパーパラメータ管理の例argparseを用いてハイパーパラメータを管理する場合,コマンドラインから直接変更できるのが便利だが,往々にして設定するハイパーパラメータが膨大になる.また,設定ファイルに記述することでハイパーパラメータを管理する場合,ハイパーパラメータの変更の度に設定ファイルを修正しなければならない. 効果的なハイパーパラメータの値を決定したい場合,複数のハイパーパラメータの試行錯誤が面倒であるだけでなく,候補となるハイパーパラメータ数に応じて設定ファイルの修正が生じ,膨大な結果の保存 & 比較が困難になる. こうした問題点は,Hydra+MLflow(tm)+Optunaにより解決できる. Hydra

                                                    Hydra, MLflow, Optunaの組み合わせで手軽に始めるハイパーパラメータ管理
                                                  • Spark+AI Summit 2019参加レポート at San Francisco — Spark3.0/Koalas/MLflow/Delta Lake

                                                    こんにちは,NTTの山室です. 今回の記事は4/23–25にサンフランシスコで開催されたSpark+AI Summitの参加レポートになります.興味のある情報への良い足がかりになることを目的に,個人的にチェックした内容を浅く広めに取り上げます. 以下の公式サイトに大半の発表資料と動画が公開されていますので,興味がある方はそちらも併せて参照してください. Spark+AI Summit 2019 Agenda Summitの翌日に訪問した会場近くのDatabricks社Spark+AI Summitは現在年に2回アメリカ西海岸とヨーロッパで開催されているDatabricks(Sparkの作者が在籍する企業)主催のイベントです.特に毎年サンフランシスコで開催されるSummitは規模が大きく,今回世界中から5,000人を超える参加者が集まったそうです. この記事では個人的に興味を持った以下の内容

                                                      Spark+AI Summit 2019参加レポート at San Francisco — Spark3.0/Koalas/MLflow/Delta Lake
                                                    • Azure Machine Learning + MLflowで実験管理とモデル管理をしつつ機械学習モデル開発をする話 - Qiita

                                                      本記事は「求ム!Pythonを使ってAzureで開発する時のTips!【PR】日本マイクロソフト Advent Calendar 2020」の17日目の記事です。空いていた枠に後日投稿しました。 Azure Machine Learning という機械学習周りの広い範囲をカバーするサービスがあります。Azure Machine Learning はデータセット管理からモデルの開発、実験の管理、モデルの管理、デプロイまで、機械学習モデルの開発に必要なほぼほぼ全ての工程をこなすことができるサービスですが、本記事ではAzure Machine Learning の機能の一部、実験管理とモデル管理部分をインターネットに接続可能な任意の Python 開発環境と組み合わせる方法を検証しつつ紹介します。 ただし、Azure Machine Learning の機能を素の状態では使用しません。最も広く使

                                                        Azure Machine Learning + MLflowで実験管理とモデル管理をしつつ機械学習モデル開発をする話 - Qiita
                                                      • mlflowを使ってデータ分析サイクルの効率化する方法を考える - Qiita

                                                        この記事について mlflowという機械学習の管理をできるPythonライブラリについて説明する mlflowを使って、データ分析サイクルを効率よく回せるかを考える mlflowとは 概要 mlflowは、機械学習の開発を行う上で複雑になりがちな実行環境、モデル、パラメータ、評価結果、その他もろもろの管理を行ってくれるプラットフォームです。モデル作成後のデプロイについても、予測結果を返してくれる簡単なAPIを提供できる機能でカバーしています。 機械学習を行う場合、scikit-learn(または、これに準拠したもの)を用いることが多いと思うので、これを使うことを前提に説明していきます。(scikit-learn以外にも、H2O、Keras、pytorch、tensorflowといったディープラーニング向けのライブラリにも対応しています。) mlflowは以下の大きな3つの機能で構成されてい

                                                          mlflowを使ってデータ分析サイクルの効率化する方法を考える - Qiita
                                                        • MLflow Tracking を用いた実験管理 / ayniy-with-mlflow

                                                          「atmaCup#5 振り返り会」での発表資料 - connpass: https://atma.connpass.com/event/178585/ - Competition GitHub: https://github.com/upura/atma-comp05 - Ayniy GitHub: https://github.com/upura/ayniy - Ayniy documentation: https://upura.github.io/ayniy-docs/ - YouTube: https://youtu.be/b-YogiJA9XA

                                                            MLflow Tracking を用いた実験管理 / ayniy-with-mlflow
                                                          • ML Pipeline事始め – kedro(+notebook)とMLflow Trackingで始めるpipeline入門 – - GMOインターネットグループ グループ研究開発本部

                                                            2020.07.06 ML Pipeline事始め – kedro(+notebook)とMLflow Trackingで始めるpipeline入門 – こんにちは。次世代システム研究室のT.S.です AI/機械学習が不可欠となった昨今、数多くの方がKaggleなどの分析コンペ参加から機械学習モデルの実験、そして本番環境への適用まで色々実施してらっしゃると思います。 私もその一員で、日々モデルの実験から本番機械学習基盤の構築まで色々な分野の機械学習関連業務に従事しております。 そうした中で(皆様も同じ悩みを抱えているかと思いますが)実験->本番適用->運用に渡って、色々な悩みを抱えています。 一例ですが、こん悩みがあります 実験を複数回繰り返した結果、実行結果とハイパパラメータの組み合わせがゴチャゴチャになる 実験時の処理がモジュール化していないため、処理順序の入れ替えや追加が困難 実験時

                                                              ML Pipeline事始め – kedro(+notebook)とMLflow Trackingで始めるpipeline入門 – - GMOインターネットグループ グループ研究開発本部
                                                            • MLflow と ONNX で実現するクラウドネイティブな MLOps

                                                              2021年8月25日(水) MLOps Community での講演資料 第10回 MLOps 勉強会(Online) ~機械学習基盤~ https://mlops.connpass.com/event/218772/

                                                                MLflow と ONNX で実現するクラウドネイティブな MLOps
                                                              • MetaflowとMLflowを使った快適ML個人開発 - Qiita

                                                                はじめに 本記事ではMetaflowとMLflowを使った個人開発用MLOpsの方法をご紹介します。 ここ数ヶ月個人で開発しているMLプロジェクトで利用してみて、いろいろなツールがある中で、MetaflowとMLflowの組み合わせが個人開発では最強であることがわかったのでシェアしたいと思います。 個人でMLの研究、開発されている方のご参考になれば幸いです。 Metaflowとは まず、MetaflowはNetflixが開発しているオープンソースライブラリで、機械学習用のワークフローパイプラインの機能を提供してくれます。似たようなツールだと、GoogleのKubeflow Pipeline (KFP)、Kedro、LyftのFlyteなんかがあります。 個人的にMetaflowを個人開発で用いるメリットはMetaflowが他のツールと比較して導入がかなり手軽な点です。設定なども特に難しいも

                                                                  MetaflowとMLflowを使った快適ML個人開発 - Qiita
                                                                • MLflow + Kubeflow MLプラットフォーム事例 #sparktokyo

                                                                  2018年12月4日 Japan Container Days 講演資料 谷脇大輔 Preferred Networksでは1000個以上のGPUとInfiniBandからなるオンプレミスのクラスターを自社で構築しており、研究者が様々な目的、リソース量、実行時間の機械学習ジョブをKubernetes上で実行して研究成果を出しています。 KubernetesはKubeflowの登場など、機械学習基盤としても非常に注目されている一方で、現実的には未だ発展途上です。 講演では機械学習基盤としてのKubernetesの導入理由、その実用性と将来性、Preferred Networksの挑戦についてお話ししました。

                                                                    MLflow + Kubeflow MLプラットフォーム事例 #sparktokyo
                                                                  • Airflow vs Luigi vs Argo vs Kubeflow vs MLFlow

                                                                    Just tell me which one to useYou should probably use: Apache Airflow if you want the most full-featured, mature tool and you can dedicate time to learning how it works, setting it up, and maintaining it.Luigi if you need something with an easier learning curve than Airflow. It has fewer features, but it’s easier to get off the ground.Prefect if you want something that’s very familiar to Python pro

                                                                      Airflow vs Luigi vs Argo vs Kubeflow vs MLFlow
                                                                    • MLflow と Amazon SageMaker による機械学習のライフサイクル管理 | Amazon Web Services

                                                                      Amazon Web Services ブログ MLflow と Amazon SageMaker による機械学習のライフサイクル管理 機械学習(ML) や MLOps の急速な普及に伴い、企業は ML プロジェクトの実験から本番までの速度を高めたいと考えています。 MLプロジェクトの初期段階では、データサイエンティストは、ビジネスニーズに対するソリューションを見つけるために、共同で実験結果を共有します。運用フェーズでは、本番に向けたさまざまなモデルのバージョンや、ライフサイクルの管理も必要です。この記事では、オープンソースのプラットフォームである MLflow がどのようにこれらの問題に対処しているかをご紹介します。完全に管理されたソリューションに興味のある方のために、Amazon Web Services は最近、re:Invent 2020で、機械学習のための初めての、継続的統合およ

                                                                        MLflow と Amazon SageMaker による機械学習のライフサイクル管理 | Amazon Web Services
                                                                      • Hydra, MLflow, Optunaの組み合わせで手軽に始めるハイパーパラメータ管理

                                                                        Optuna meetup #1 で使用した資料です.

                                                                          Hydra, MLflow, Optunaの組み合わせで手軽に始めるハイパーパラメータ管理
                                                                        • Python: MLflow Models を使ってみる - CUBE SUGAR CONTAINER

                                                                          MLflow は MLOps に関連した OSS のひとつ。 いくつかのコンポーネントに分かれていて、それぞれを必要に応じて独立して使うことができる。 その中でも、今回扱う MLflow Models は主に学習済みモデルやパイプラインの取り回しに関するコンポーネント。 MLflow Models を使うことで、たとえば学習済みモデルの Serving やシステムへの組み込みが容易になる可能性がある。 使った環境は次のとおり。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.15.6 BuildVersion: 19G73 $ python -V Python 3.8.5 $ pip list | egrep "(mlflow|lightgbm|scikit-learn)" lightgbm 3.0.0 mlflow 1.11.0 sc

                                                                            Python: MLflow Models を使ってみる - CUBE SUGAR CONTAINER
                                                                          • MLFlowと他ツールの組み合わせ - Retrieva TECH BLOG

                                                                            こんにちは。カスタマーサクセス部 リサーチャーの坂田です。 レトリバでは、固有表現抽出、分類、PoC用ツール作成に取り組んでいます。 PoC用ツール作成は、研究成果をより迅速にPoCで試せることを狙いとしています。 実験結果の可視化UIが充実しているMLFlow を中心に、足りないところを補うため、その他のツールとの組み合わせについて考えていきます。 MLFlow MLFlow は、実験管理からデプロイまでカバーしたツールです。特定のツールに依存しないということに重きを置いています。 4つのコンポーネントに分かれており、必要な機能のみを使えるようになっています。 MLflow Tracking : パラメータ、コードのバージョン管理、生成物の捕捉などを行う機能など。 MLflow Projects : 再現性を担保するための機能など。 MLflow Models : デプロイの支援機能など

                                                                              MLFlowと他ツールの組み合わせ - Retrieva TECH BLOG
                                                                            • GitHub - Minyus/pipelinex: PipelineX: Python package to build ML pipelines for experimentation with Kedro, MLflow, and more

                                                                              PipelineX is a Python package to build ML pipelines for experimentation with Kedro, MLflow, and more PipelineX provides the following options which can be used independently or together. HatchDict: Python in YAML/JSON HatchDict is a Python dict parser that enables you to include Python objects in YAML/JSON files. Note: HatchDict can be used with or without Kedro. Flex-Kedro: Kedro plugin for flexi

                                                                                GitHub - Minyus/pipelinex: PipelineX: Python package to build ML pipelines for experimentation with Kedro, MLflow, and more
                                                                              • MLflow 〜これで機械学習のモデル管理から API 作成まで楽にできるかも〜 - Qiita

                                                                                ※下記に 1.0.0 版の記事書きました MLflow 1.0 リリース!機械学習ライフサイクルを始めよう! - Qiita はじめに 機械学習をサービスとして運用するには以下のステップが必要となるのではないでしょうか。 (ちなみに仕事できかいがくしゅうしたことないので下記の 99 割は根拠無いです ) 要件定義 目的や目標値の確認 「機械学習のスコアが高い」と「要件を満たす」は等価じゃないことに注意 どう提供するのか 入力値がわかりきっているなら、夜間バッチで全通り予測するとか とはいえ大抵分からないから随時入力を受け取ったら予測するようにしたいのです API としてアプリケーションサーバーから呼ぶ ← 今回想定していること データの分析 EDA(探索的データ分析)ともいう 困ったら最低下記だけでもやれば良い気がしてます 【Pythonメモ】pandas-profilingが探索的データ

                                                                                  MLflow 〜これで機械学習のモデル管理から API 作成まで楽にできるかも〜 - Qiita
                                                                                • MLflow and PyTorch — Where Cutting Edge AI meets MLOps

                                                                                  Authors: Geeta Chauhan, PyTorch Partner Engineering Lead and Joe Spisak, PyTorch Product Lead at Facebook PyTorch has continued to evolve rapidly since the introduction of PyTorch 1.0, which brought an accelerated workflow from research to production. Looking at the momentum in research, as shown on paperswithcode.com/trends, we can see that the research community has embraced PyTorch as its tool

                                                                                    MLflow and PyTorch — Where Cutting Edge AI meets MLOps