並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 485件

新着順 人気順

mlflowの検索結果241 - 280 件 / 485件

  • MLflow: 4. Model Registry を使った実験管理 - connecting the dots

    はじめに 環境情報 前回までのMLflowシリーズ MLflowとは Model Registryとは Model Registryでできること モデルのバージョン管理 モデルのステージの遷移管理 モデルのコード管理 モデルの概要管理 モデルのデプロイ管理 モデルサービング Model Registryのワークフロー 1.モデルの登録 2.モデルのバージョン登録 3.モデルステージ遷移 4.モデルサービング UIでの基本的な操作 1.モデルを登録する 2.モデルのバージョンを登録する 3.モデルのステージを登録する 4.モデルサービング APIでの基本的な操作 モデルを登録する モデルレジストリからMLflowモデルを取得する モデルレジストリからMLflowモデルをデプロイする MLflowモデル情報の追加と更新 まとめ 参考 はじめに 今回はMLflowシリーズの最後の機能であるMLf

      MLflow: 4. Model Registry を使った実験管理 - connecting the dots
    • MLflowを用いた分類エンジンの刷新 - Retrieva TECH BLOG

      こんにちは。レトリバの飯田(@HIROKIIIDA7)です。TSUNADE事業部 研究チームのリーダーをしており、分類エンジンの開発・マネジメント、検索分野の研究、チームマネジメントを行っています。 今回は、前回の記事から自己紹介に追加されている「分類エンジンの開発・マネジメント」について書いていきます。これは、チームで取り組みました。 経緯 レトリバでは、その前身のPreferred Infrastructure時代から自然言語処理に取り組んでいました。文書・文分類は基本タスクの一つであり、応用でも非常に多く取り組む機会があります。そのため、実験管理も含めたエンジンを10年以上前から作っていました。 このエンジンはコア部分がC++で作られていました。そのため、モデルの追加はC++で行うことになります。また、パラメータ管理をRailsで行っていた結果、新しいモデルのパラメータ設定はRail

        MLflowを用いた分類エンジンの刷新 - Retrieva TECH BLOG
      • MLflowをGKEで動かす快適な実験管理ハンズオン | AI tech studio

        AI Labの岩崎(@chck)です、こんにちは。今回は前記事よりも実践的な、AI Labにおける実験管理システムの話をしたいと思います。ここでいう実験とは、データを収集・加工し、統計や機械学習を用い、設定したタスクや仮説を明らかにすることです。実験管理とはその評価や使ったパラメータ及び実験コードを再現できる形で保管することを指します。 対象読者 個人や大学、企業所属でJupyterLab上の実験管理に苦労している方 チームでKaggle等のデータ分析コンペに参加している方 Kubernetes、GCP、Terraformといったキーワードに興味のある方 tl;dr MLflowをGKEに載せることで、高可用でユーザ認証を持つMLflow Tracking Serverを作りました。更にTerraformによる1command構築を目指しました。中規模以上の研究室を想定し、Load Bal

          MLflowをGKEで動かす快適な実験管理ハンズオン | AI tech studio
        • GitHub - hppRC/template-pytorch-lightning-hydra-mlflow-poetry: An easy to use ML template project using Pytorch-Lightning, Hydra, Mlflow, and Poetry.

          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

            GitHub - hppRC/template-pytorch-lightning-hydra-mlflow-poetry: An easy to use ML template project using Pytorch-Lightning, Hydra, Mlflow, and Poetry.
          • Jupyter+MLflowが動作するKaggle環境をDockerでリモートサーバ上に構築する

            JupyterとMLflowが動作する環境をリモートサーバ上に構築する方法の備忘録です。 MLflow自体の使い方などは以下の記事が参考になるかと思います。 https://qrunch.net/@currypurin/entries/sECZEcH9OVg4K2iq tl;dr Dockerとdocker-composeがインストール済みの環境で以下のリポジトリのREADMEの通りに実行してください。 https://github.com/shinsuke27/kaggle-docker-with-mlflow Kaggleの公式Dockerイメージをベースに、自分専用のKaggle環境が立ち上がり http://localhost:8080/ http://localhost:5000/ でJupyterとMLflowにアクセスできるはずです。 構成 Dockerfile Docker

              Jupyter+MLflowが動作するKaggle環境をDockerでリモートサーバ上に構築する
            • Easy Hyperparameter Management with Hydra, MLflow, and Optuna

              Two major methods can be considered for hyperparameter management in machine learning. Configuring hyperparameters from the command line using argparse Hyperparameter management via configuration filesAn Example of a Typical Hyperparameter ManagementWhen using argparse for managing hyperparameters, it is convenient to change them directly from the command line, but the number of hyperparameters to

                Easy Hyperparameter Management with Hydra, MLflow, and Optuna
              • AI Adoption in the Enterprise 2021

                Join the O'Reilly online learning platform. Get a free trial today and find answers on the fly, or master something new and useful. Learn more Executive Summary We had almost three times as many responses as last year, with similar efforts at promotion. More people are working with AI.In the past, company culture has been the most significant barrier to AI adoption. While it’s still an issue, cult

                  AI Adoption in the Enterprise 2021
                • 小さいMLOpsってこんなもんかと思ってやってみる - Re:ゼロから始めるML生活

                  この間はMetaflowを使ってみました。 www.nogawanogawa.com ワークフロー管理+実験管理が可能なように、Metaflow + MLFlowを使ってコードを書いてみたいと思います。 多分、これだけでもMLOpsのごくごく一部は対応できていると思うので、今回はそのメモです。 参考 お題 文書生成 今回の主な技術要素 ワークフロー管理:MetaFlow 実験管理:MLFlow やってみる Metaflow MLFlow 考察 書いたもの 感想 参考 下記の記事で、小さく始めて大きく育てるMLOpsという内容が紹介されていました。 cyberagent.ai こちらの記事では、「Hydra、MLflow Tracking、Kedro、Optunaを導入するところから始めてみては?」といった趣旨になっていました。 Hydraを使ってハイパーパラメータの管理、Optunaを使っ

                    小さいMLOpsってこんなもんかと思ってやってみる - Re:ゼロから始めるML生活
                  • データレイクハウス + 機械学習基盤 on Azure - Qiita

                    はじめに こんにちは、イトーです。 「データ基盤が未整備だけどデータを CSV で貰って機械学習して、良い感じのモデルができた。本番投入どうしよう」というような状況の案件に支援に入ることが今年何度かありました。このような場合には運用を支える基盤が必要になるのですが、今のところデータレイクハウスと機械学習基盤の組み合わせから始めるとなかなか良いのではないかと思っており、今日はこの組み合わせで Azure 上にデータ処理基盤&機械学習基盤を実装してみようと思います。実装をしている時間がなくなってしまったので概念の説明だけしようと思いますすいません。 アーキテクチャ データレイクハウス概要 データレイクハウスは、データ処理エンジンから直接アクセス可能な低コストなストレージを中心に据えたデータ管理アーキテクチャです。 「データ処理エンジンから直接アクセス可能な低コストなストレージ」は、技術的にはデ

                      データレイクハウス + 機械学習基盤 on Azure - Qiita
                    • (TV) Khabib vs Gaethje Live: UFC 254 Live | Free TV ONLINE Today

                      (TV) Khabib vs Gaethje Live: UFC 254 Live | Free TV ONLINE Today Watch UFC 254 Live: Fight Khabib vs Gaethje Online UFC 254: Khabib Nurmagomedov vs Justin Gaethje Live. Watch this game live and online for free. Live Events Khabib Nurmagomedov vs Justin Gaethje. Image for post UFC 254 Live Stream: How To watch Watch Live Here 🔴👉 https://stream24live.online/ufc/ Khabib Nurmagomedov vs Justin Gaeth

                        (TV) Khabib vs Gaethje Live: UFC 254 Live | Free TV ONLINE Today
                      • Apache Spark、MLflow、Delta Lakeを使いこなすための中級入門書 『Apache Spark徹底入門』発売

                        本書はビッグデータを主な対象とするデータ分析フレームワーク「Apache Spark」「MLflow」「Delta Lake」を使いこなすための中級者向け解説書です。 Apache Sparkの導入から説明し、Spark SQLとデータフレーム、データセットを紹介。Apache Sparkを用いたデータ分析においてどのように機械学習を利用すればいいのか、アルゴリズムの採用から実装まで解説します。 データベースエンジンの最適化やバージョニング(Delta Lake)、モデルを管理するMLflowについて詳しく取り上げているので、データ分析基盤を構築するための知識をひとまとめにして学べます。 また、日本語版のオリジナルコンテンツとして、pandas DataFrameとSparkDataFrameに関する各種データフレームの使い分け、LLMやEnglish SDK for SparkなどAIを

                          Apache Spark、MLflow、Delta Lakeを使いこなすための中級入門書 『Apache Spark徹底入門』発売
                        • Data + AIサミット2021で発表されたDatabricksの新機能 - Qiita

                          Data + AI Summit North America 2021 - Databricksで発表された新機能の紹介記事です。 Delta Sharingのご紹介 : セキュアなデータ共有のためのオープンプロトコル - Qiita 企業間のデータ共有をシンプルにするための新たなオープンソースプロジェクト: 製品間の大規模データのセキュアなリアルタイムのデータ交換を初めて実現 Databricks Unity Catalogのご紹介:レイクハウスにおけるデータとAIに対するきめ細かいガバナンス - Qiita 馴染みのあるオープンなインタフェース(SQL)を用いて、レイクハウスのデータにきめ細かいガバナンスとセキュリティを提供 Delta Live Tablesのローンチ : 信頼性のあるデータエンジニアリングを簡単に実現 - Qiita 宣言型パイプライン開発、改善されたデータの信頼性

                            Data + AIサミット2021で発表されたDatabricksの新機能 - Qiita
                          • Uplight、Databricks と Google Cloud を使用してエネルギー分析ソリューションを効率的に提供 | Google Cloud 公式ブログ

                            Uplight、Databricks と Google Cloud を使用してエネルギー分析ソリューションを効率的に提供 ※この投稿は米国時間 2023 年 5 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。 「大いなる力には大いなる…」という格言があります。通常は「大いなる責任が伴う」と続きますが、今回は「大量のデータが伴う」という話です。そして、そのデータが温室効果ガス排出量の削減につながるとしたらどうでしょうか。 Uplight はまさにそれを担うことをミッションに掲げています。Uplight は、元データとその分析情報を使用して顧客の行動を動機付けることで、エネルギー プロバイダがよりサステナブルな未来を創出できるようサポートしています。顧客の行動とは、一貫した行動の変化から、エネルギー効率の高いデバイスの購入、電力網支援プログラムへの登録まで多岐

                              Uplight、Databricks と Google Cloud を使用してエネルギー分析ソリューションを効率的に提供 | Google Cloud 公式ブログ
                            • MLflowをオンプレサーバーで構築する

                              こんにちは.今回は実験管理ツールであるMLflowをオンプレミスで構築する方法についてご紹介します. 導入の動機 機械学習を扱っていると,ハイパーパラメータやモデル,データセットを変更しながら様々な実験を行うことになります.この際,結果の比較を効率的に行える実験管理ツールを導入することで,モデルの開発に集中できます. この手の実験管理ツールは,MLOpsが盛んな今,TensorboardやWeight & Bias(wandb)など,様々ありますが,最近はMLflowが選択肢として大きく盛り上がっています. しかし,様々ある実験管理ツールの中で,データの外部送信を行わずに扱える「オンプレミス」「自前サーバ」という点に着目すると選択肢はさほど多くなく,最も使われているであろうMLflowを構築してみようと思います. MLflowとは Mlflowはオープンソースの機械学習のライフサイクル管理

                                MLflowをオンプレサーバーで構築する
                              • 技術書を書く - Qiita

                                前置き 2023年Advent Calendar集まれ文系エンジニア!1日目の投稿です。 私はこれまでに2冊の技術書を執筆し、現在はSoftware Designという雑誌でMLOpsに関する記事を毎月連載(2023年8月号〜)しています。 AIエンジニアのための機械学習システムデザインパターン(翔泳社) 現場で使える!機械学習システム構築実践ガイド デザインパターンを利用した最適な設計・構築・運用手法(翔泳社) ソフトウェアデザイン2023年12月号(技術評論社) いずれの本も出版社から出していて、執筆にあたって編集者にご協力いただいています。この場を借りて御礼申し上げます。 漫画や小説を出版する流れを書いた作品は多々ありますが、技術書を書くことについてまとまった記事は多くない印象です。本記事では技術書を書くことについて、私の経験した手順や知見を共有します。 なお、私は自費出版の経験はな

                                  技術書を書く - Qiita
                                • Mosaic AI Playground で Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro と同時にチャットする - Qiita

                                  ジョーク これはネタですが「システムエンジニアにかけて、ギャグを1つお願いします」と質問して見ました。システムエンジニアの笑いのタネの共通項がエラーやバグであることがわかりました😂 とはいえ、各 LLM で特色が違う回答となって面白いです。 参考:Gemini 1.5 Pro の回答全文 システムエンジニアに捧げるギャグ あるシステムエンジニアが、深夜まで残業をしていました。 すると、突然パソコンの画面が真っ暗になり、エラーメッセージが表示されました。 エンジニアは焦って、エラーメッセージを何度も読み返しました。 しかし、エラーメッセージは意味不明な文字列の羅列で、何を意味しているのか全く分かりませんでした。 エンジニアは途方に暮れて、思わず天を仰ぎました。 すると、空から声が聞こえてきました。 「エラーメッセージは、こう読めばいい。」 エンジニアは、その声に従ってエラーメッセージを読み

                                    Mosaic AI Playground で Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro と同時にチャットする - Qiita
                                  • 2023前半kaggle参戦記

                                    はじめに 今年開催された2つのテーブルコンペであるGoDaddy、PSPにて、それぞれソロ参加で銀メダル(152/3547位、49/2051位)を獲得し、Competitions Expertに昇格しました。この記事ではコンペで得られた知見や、自分がどのように戦ったかなどをまとめていきたいと思います。Expertを目指して頑張っている方や、機械学習コンペに興味を持っている方などの参考になれば幸いです。 目次 はじめに 誰ですか? コンペ概要 参戦前の筆者のスペック 参戦記 金を取るために まとめ 誰ですか? はじめまして、tonicと申します。人生初記事投稿なので軽く自己紹介しようと思います。僕は普段フリーランスとしてデータサイエンティストやら機械学習エンジニアやらをやりつつ、kaggleのコンペに参加したり勉強したりといった生活をしています。kaggleでは主にテーブルコンペをやっていま

                                      2023前半kaggle参戦記
                                    • データブリックス、企業による AI 活用の急増により、 日本での記録的な成長を達成

                                      顧客および国内パートナー企業が 2 倍以上に拡大し、事業成長は前年比 100% 超 データと AI の企業である Databricks(本社:米国カリフォルニア州サンフランシスコ、以下「データブリックス」)は、日本における企業のデータおよび AI 活用に対する需要の急増を背景に、2023年度の日本事業の成長率が、前年比 100% 超となったことを、本日発表しました。 データブリックスの2023年度(2023年2月~2024年1月)のグローバルにおける収益は16億米ドルを超え、前年比50%以上の成長を達成しました。これは、迅速な製品イノベーションがけん引したことによるものです。昨年度、データブリックスは、日本における新規顧客を大幅に増やしました。イオン株式会社、全日本空輸株式会社(ANA)、株式会社ブリヂストン、コスモエネルギーホールディングス株式会社、コニカミノルタ株式会社、ネットワンシス

                                        データブリックス、企業による AI 活用の急増により、 日本での記録的な成長を達成
                                      • DATAFLUCT Tech Blog

                                        2022-08-27 データ抽出に特化したAirbyteによるEL(T) 環境構築の実践 データ基盤 Airbyte ELT こんにちは。今回は、データ基盤の構築の一部を実際に体験してみたいと思います。 データ基盤を作成するにあたり、まずは、社内に眠る様々なデータを集めてくる必要があります。前回の記事では、その機能を「収集」と紹介していました。 データ基盤とは何か… データ基盤 データ分析基盤 実践 2022-08-18 Metaflowでモデルの学習をpipeline化するまで MLOps Metaflow Pipeline 皆さんは「MLOps」について取り組んでいらっしゃるでしょうか。私は2018年頃からデータクレンジングや機械学習モデルの構築や運用をしてきましたが、当時の日本で私の耳にはMLOpsという言葉が入ってくることはありませんでした。 ただMLOpsの元となった「Dev…

                                          DATAFLUCT Tech Blog
                                        • MLflow上でOptunaによって生成される大量のrunを整理する | フューチャー技術ブログ

                                          はじめにこんにちは、SAIG/MLOpsチームでアルバイトをしている齋藤です。 MLflowは機械学習の管理を扱うツールとして、Optunaはハイパーパラメータを自動調整するツールとしてともに広く使用されているツールです。MLflowとOptunaを同時に利用した際に、Optunaが複数回試行することによってMLflow上にrunが大量に生成され、MLflow上で試行結果が見づらくなります。 本記事では、大量に生成されるrunに親のrunを付与することで、MLflowのWeb UIから見やすくする方法を提示します。 課題Optunaは事前に指定した範囲の中からハイパーパラメータの組み合わせを自動的に選択してモデルを学習して評価するという試行を繰り返すことで、良いハイパーパラメータを探索するツールであり、これにより手作業でハイパーパラメータを調整するのを省けます。 MLflowは機械学習の管

                                            MLflow上でOptunaによって生成される大量のrunを整理する | フューチャー技術ブログ
                                          • MLflowでkerasモデルなどを管理してみた - Qiita

                                            (mlflow_example)$ pip install tensorflow (mlflow_example)$ pip install keras (mlflow_example)$ pip install mlflow (mlflow_example)$ pip install sklearn (mlflow_example)$ pip install matplotlib お試し最小限の環境がこれで作ることができました。 実装の前に・・・ 前提条件 今回は以下の条件をコマンドライン引数で指定できるようにします。 実験名 MLflowに与える実験名(例:mnist_cnn とか fashion_fully) データセット MNIST Fashion-MNIST モデル 全結合モデル CNNモデル パラメータ(今回は適当に・・・) 初期学習率 Epoch数 バッチサイズ MLflow

                                              MLflowでkerasモデルなどを管理してみた - Qiita
                                            • データブリックス - Wikipedia

                                              Databricksは、Apache Sparkの生みの親であるマテイ・ザハリアと共に、アリ・ゴディシが2013年に設立した企業である[1] 。 AI/機械学習をはじめとするビッグデータを扱うためのクラウド型の統合データ分析基盤である「レイクハウス・プラットフォーム」を提供しており、データエンジニアリング、データサイエンス/機械学習、データ分析の領域に強みがある。 2022年に上場予定と言われているユニコーン企業であり、2021年8月に発表したシリーズHの資金調達後の市場価値は約4兆円となっている。[2]。2021年12月現在、世界で7,000社を超える企業に利用されており[3]、テクノロジー販売パートナーは約450社となっている[4]。 2021年ガートナー「マジッククアドラント」において、データサイエンスおよび機械学習プラットフォーム部門のリーダーとして評価されている[5]。また、20

                                                データブリックス - Wikipedia
                                              • Spark + AI Summit Europe に参加しました! - 株式会社ロンウイット

                                                著者:ゴンザレス エルピディオ 2019年10月14〜16日にオランダで開催されたSpark + AI Summit Europeにロンウイットの代表として参加してきました。イベントは、アムステルダムのZuidasビジネス地区にあるRAIコンベンションセンターで開催されました。Spark + AI Summit Europeはヨーロッパ最大のデータおよび機械学習カンファレンスであり、毎年63か国から2,000人以上が参加しています。本カンファレンスは主にキーノート、事例発表のセッション、ワークショップ、トレーニングで構成されています。どのトピックにおいても Apache Spark™ や TensorFlow などのオープンソーステクノロジーの最新の動向と、AIを現実世界に展開するためのベストプラクティスが得られることが特徴です。 以下に、有償トレーニングの内容と特に興味深いと思ったキーノ

                                                  Spark + AI Summit Europe に参加しました! - 株式会社ロンウイット
                                                • Canonical、機械学習の工程管理に向けた「Charmed MLFlow」を提供開始

                                                  英Canonicalは、機械学習の工程管理に向けたツール群「Charmed MLFlow」の提供を9月26日(現地時間)に開始した。Charmed MLFlowは、オープンソースの「MLFlow」をCanonicalがサポートなどを付けて提供するもの。同社の「Ubuntu Pro」サブスクリプションの契約者に提供するほか、ノードごとの料金を支払うことでも利用できる。Canonicalは、Charmed MLFlowについてセキュリティ・パッチを10年間提供し続けることを約束している。 Charmed MLFlowは、機械学習モデルを動かすたびに、コードやパラメーター、結果などを自動的に記録し、どのような条件でどのような結果が出たのかを容易に見直すことができる環境を提供する。機械学習実行時のさまざまな条件は、すべてを手入力で記録するのが難しいほどの量になる。実行時の条件と結果をセットで管理で

                                                    Canonical、機械学習の工程管理に向けた「Charmed MLFlow」を提供開始
                                                  • LangChain on Databricks for LLM development

                                                    この記事では、Databricks での大規模な言語モデル (LLM) の開発とデプロイを容易にする LangChain 統合について説明します。 これらの LangChain 統合を使用すると、次のことができます。 PySpark DataFrame ローダーを使用して、PySpark DataFrame からデータをシームレスにロードします。 Spark DataFrame エージェントまたは Databricks SQL エージェントで自然言語を使用してデータを対話的にクエリします。 Databricks で提供されるモデルを LangChain で大規模言語モデル (LLM) としてラップします。 ラングチェーンとは何ですか? LangChainは、大規模な言語モデル(LLM)を利用するアプリケーションの作成を支援するように設計されたソフトウェアフレームワークです。 LangCha

                                                      LangChain on Databricks for LLM development
                                                    • メモ:AzureMLオンラインエンドポイント/デプロイメントのログ - Qiita

                                                      ログ形式の自分用メモです。 An managed online endpoints created on Nov 21, 2022. Instance status: SystemSetup: Succeeded UserContainerImagePull: Succeeded ModelDownload: Succeeded UserContainerStart: Succeeded Container events: Kind: Pod, Name: Downloading, Type: Normal, Time: 2022-11-21T15:03:47.365747Z, Message: Start downloading models Kind: Pod, Name: Pulling, Type: Normal, Time: 2022-11-21T15:03:48.738717Z

                                                        メモ:AzureMLオンラインエンドポイント/デプロイメントのログ - Qiita
                                                      • Azure Machine LearningワークスペースをCLIv2で操作する 入門編2-推論エンドポイント立ち上げ - JBS Tech Blog

                                                        概要 やりたいこと 準備 Azure CLI 拡張機能(CLIv2)による推論エンドポイントのデプロイ 学習済みモデルの登録 モデルのダウンロード ローカル環境ファイルの登録 エンドポイントの作成 エンドポイントの定義 エンドポイントの環境構築 Webサービスのテスト おわりに 概要 本記事はAzure Machine LearningワークスペースをCLIv2を使って操作するチュートリアルの第2弾です。 使い方を習得すれば自動化パイプラインを自身で構築できるようになります。 やりたいこと 前回の記事でAzure Machine Learningのリソースを使って学習を実行ところまで進みました。 この段階では作成したモデルをローカル環境でしか使用することができません。公開する際には、推論エンドポイントをデプロイする必要があります。 本記事では引き続きCLIv2を使用し、Azure Mach

                                                          Azure Machine LearningワークスペースをCLIv2で操作する 入門編2-推論エンドポイント立ち上げ - JBS Tech Blog
                                                        • データブリックス、Google Cloudとパートナーシップを発表 グローバル規模で迅速かつセキュアにプラットフォームを展開

                                                          データブリックス、Google Cloudとパートナーシップを発表 グローバル規模で迅速かつセキュアにプラットフォームを展開データブリックス、Google BigQueryとAI プラットフォームとの統合により、Google Cloud上でデータエンジニアリング、データサイエンス、機械学習、アナリティクスのサービスを開始 サンフランシスコ - 2021年2月17日 - データ・AI企業のDatabricks 社(本社:米国カリフォルニア州サンフランシスコ、以下:データブリックス)は、Google Cloud上でデータブリックスをグローバル規模で提供するための新たなパートナーシップを発表しました。このパートナーシップにより、企業はデータブリックスを使用して、Google Cloudのグローバルでスケーラブルかつ弾力性のあるネットワーク上に、データエンジニアリング、データサイエンス、機械学習、

                                                            データブリックス、Google Cloudとパートナーシップを発表 グローバル規模で迅速かつセキュアにプラットフォームを展開
                                                          • Databricksにおけるカスタムモデルのトレーニング、SageMakerエンドポイントへのデプロイメント - Qiita

                                                            Databricksにおけるカスタムモデルのトレーニング、SageMakerエンドポイントへのデプロイメントAWSDatabricksSageMakerMLflow Databricks MLflowのモデルサービングは、モデルのテスト目的でクイックにモデルの動作確認するという目的には適していますが、大量の同時アクセスが予期される、モデルで使用するデータをS3から取得するなど複雑な前処理を組み込みたいといった要件があるプロダクション目的でモデルをサービングする際にはSageMakerのエンドポイントなどを使用することをお勧めしています。 特に、機械学習モデルの推論処理の前処理として「モデルを呼び出す際、IDを指定し推論に用いるデータをS3から取得する」という要件がある場合、PyFuncとしてモデルを実装・トレーニングし、モデルをSageMakerのエンドポイントにデプロイするアプローチを取

                                                              Databricksにおけるカスタムモデルのトレーニング、SageMakerエンドポイントへのデプロイメント - Qiita
                                                            • 機械学習の操作 - Cloud Adoption Framework

                                                              このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。 機械学習の操作 (MLOps とも呼ばれる) とは、AI を取り入れたアプリケーションに DevOps の原則を適用することを指します。 組織で機械学習の操作を実装するには、特定のスキル、プロセス、テクノロジが導入されていなければなりません。 目標は、堅牢かつスケーラブルで信頼性が高く、自動化された機械学習ソリューションを提供することです。 この記事では、組織レベルで機械学習の操作をサポートするリソースを計画する方法について説明します。 Azure Machine Learning を使用してエンタープライズで機械学習の操作を導入することに基づいて、ベスト プラクティスとおすすめ候補についてレビューします。

                                                                機械学習の操作 - Cloud Adoption Framework
                                                              • Pinterestの広告ランキングの仕組みを解き明かす

                                                                ユーザーがプラットフォーム上の特定の要素を操作すると、多くの場合、様々な類似コンテンツが提示される。これは、ターゲット広告が登場する重要な瞬間である。これらの広告は、プラットフォーム内のユーザーと広告主のコンテンツのギャップを埋めることを目的としている。その目的は、関連性の高いコンテンツでユーザーを引き付け、プラットフォームから広告主のウェブサイトに誘導することだ。 これは双方向の市場である。Pinterest、Meta、Googleのような広告プラットフォームは、ユーザーと広告主や関連コンテンツを結びつける手助けをする。ユーザーはコンテンツに関与するためにプラットフォームを訪問する。広告主は、ユーザーがコンテンツを表示してユーザーに興味を持ってもらうために、これらの広告プラットフォーム料金を支払う。プラットフォームは、ユーザー、広告主、プラットフォームの価値を最大化したいと考えている。

                                                                  Pinterestの広告ランキングの仕組みを解き明かす
                                                                • Azure Machine LearningでJetBotのAIモデルをトレーニングする - JBS Tech Blog

                                                                  先端技術部テクノロジーリサーチグループの渡邊です。 テクノロジーリサーチグループでは、今期から「インダストリアルメタバース」に関する技術調査を行っており、NVIDIAのオープンソースAIロボットJetBotを使って以下のような検証を計画しています。 AIを使った自律移動 デジタルツインによる可視化 デジタルツインによるシミュレーション 前回の記事(AIロボット「JetBot」を動かす - JBS Tech Blog)では、JetBotの組み立てと動作確認を完了しました。 今回はAzure Machine Learning Serviceを活用して、JetBotを動作させる上で必要なAIモデルのトレーニングを行います。 前提 ML Clientのロード データセットの準備 カスタム環境の構築 トレーニングコンポーネントの構築 評価コンポーネントの構築 MLパイプラインの構築 MLパイプライン

                                                                    Azure Machine LearningでJetBotのAIモデルをトレーニングする - JBS Tech Blog
                                                                  • 2023年のSnowpark for Python関連のリリースを振り返る - Qiita

                                                                    「ー」は時期が不明(調査しきれていない)であることを示します。「未」は未定であることを示します。「Soon」はSnowflakeのイベントなどで直にリリースすることを表明している場合を示します。 上表はわかりやすさのためカテゴリ別にまとめていますが、ここからは時系列順に紹介していきます。みんなにも、怒涛のリリース感を味わってほしい。 2022年末のリリース状況 2023年のアップデートを見ていく前に、ベースとなる2022年末のリリース状況について確認します。 2022年6月 Snowpark for Python 基本機能群(👀Public Preview) Snowpark for Pythonの基本機能が一気にPublic Previewとなりました!2021年末にPrPrだったので、長かったような、短かかったような・・・。とても期待感を持ってリリースを待っていたので、私個人としては

                                                                      2023年のSnowpark for Python関連のリリースを振り返る - Qiita
                                                                    • Openhack resources - Qiita

                                                                      Openhack resources 備忘もかねて Openhack for Lakehouse で参考となる情報をまとめます。 ソースコード clone用:https://github.com/microsoft/openhack-for-lakehouse-japanese.git dbc用:https://github.com/microsoft/openhack-for-lakehouse-japanese/releases/tag/v1.1.1 旧バージョン(3日間版+tip増の大容量版):https://github.com/microsoft/openhack-for-lakehouse-japanese/releases/tag/v1.0.0 共通 Databricks 無償版(コミュニティプラン) https://qiita.com/taka_yayoi/items/f0

                                                                        Openhack resources - Qiita
                                                                      • Databricks on Google Cloudのセキュリティベストプラクティス - Qiita

                                                                        レイクハウスパラダイムによって、企業は分析、データサイエンス、機械学習(ML)、ビジネスインテリジェンス(BI)で活用するすべてのデータを一つの場所に蓄積できる様になります。一つの場所にすべてのデータを集めることで、生産性を向上させ、コラボレーションの障壁を打ち砕き、イノベーションを加速します。 企業がデータレイクハウスのデプロイを進めていくと、多くの場合において、彼らのポリシーによって統治されたセキュリティや適切なアクセスや監査可能性のコントロールをどの様に実装するのかに関する疑問を持つことになります。一般的な疑問には以下の様なものが含まれます。 自分のVPC(ネットワーク)をDatabricks on Google Cloudに持ち込むことができますか?(例:共有VPC) どうすれば許可されたネットワークからDatabricks(WebappやAPI)にリクエストできるようにすることが

                                                                          Databricks on Google Cloudのセキュリティベストプラクティス - Qiita
                                                                        • どのようにビデオストリーミングサービスに対するサービス品質(QoS)分析ソリューションを構築するのか - Qiita

                                                                          How to Build a QoS Solution for OTT Services - The Databricks Blogの翻訳です。 ビデオストリーミングサービスにおける品質の重要性 従来の有料TVは活気を失い続けており、コンテンツ所有者は自身のコンテンツライブラリをマネタイズするために、ダイレクトツーコンシューマー(D2C)のサブスクリプションや、広告付きのストリーミングに軸足を置いています。すべてのビジネスモデルが素晴らしいコンテンツを制作し、ディストリビューターにライセンスする企業においては、完全なガラス張りの体験へのシフトは、顧客にコンテンツをデリバリーするためのメディアサプライチェーン、数多くのデバイスとオペレーティングシステムをサポートしたアプリ、請求やカスタマーサービスのようなカスタマーリレーションシップなど、新たな機能が必要となりました。 多くのvMVPD(バー

                                                                            どのようにビデオストリーミングサービスに対するサービス品質(QoS)分析ソリューションを構築するのか - Qiita
                                                                          • Azure Machine LearningのVNETデプロイとMLFlowによるDatabricksのトラッキング - Qiita

                                                                            はじめに Azure Machine LearningはVNETテクノロジーでセキュリティ保護することができるが、複数のサービスが関連しているため、その構成は少し複雑だ。公式docを参照することでおおよそその意味しているところは理解できるが、実際に構築するとなるとそれなりにはまるような予感がするため、今回実際に試してみようと思う。ちなみに公式docを読んでの理解としては以下の通り。 Machine Learning workspace自体はVNET内にデプロイすることができないが、Private Endpointを設定することでVNET経由でのアクセスに限定することはできる。 Machine Learning Compute クラスターは通常の仮想マシン同様にVNET内にデプロイすることができる。 推論用のクラスター (ACI, AKS) はVNET内にデプロイすることができる。 その他関

                                                                              Azure Machine LearningのVNETデプロイとMLFlowによるDatabricksのトラッキング - Qiita
                                                                            • ゴジラの画像認識モデルの前処理と学習とデプロイまでをいい感じにしてみる - Qiita

                                                                              この記事は、"ちゅらデータアドベントカレンダー"の20日目です。 遅刻なのにまだ中途半端な記事です。明日完成させます。 概要 ここ最近はMLOpsに興味があり、情報をあさったり本読んだりしているうちなーんちゅです。 ちゅらデータの周年祭で披露したゴジラ画像分類APIですが、VGG16のモデルをファインチューニングして適当にGoogle画像検索で集めた画像を使って学習したところゆるーい感じで分類することができるようになりました。 こんなやつ ただ、披露したところ、黒い人がゴジラと分類されたり、ガメラがゴジラに分類されたりとまだまだ学習やデータが足りない感じです。 ①データ集める → ②ラベル付与 → ③データ配置 → ④学習用のJupyter notebookを上から叩く → ⑤結果を確認する の、サイクルを手動でやるのですが、何度も実行するのは面倒ですよね。ってことでワークフロー化したいな

                                                                                ゴジラの画像認識モデルの前処理と学習とデプロイまでをいい感じにしてみる - Qiita
                                                                              • Microsoft Certified: Azure Data Scientist Associate - Certifications

                                                                                この試験の受験者は、データ サイエンスと機械学習を応用して Azure 上で機械学習ワークロードを実装して実行するための、対象領域の専門知識を持っている必要があります。 このロールの責任には、以下が含まれます。 データ サイエンス ワークロードに適した作業環境の設計と作成。 データの探索。 機械学習モデルのトレーニング。 パイプラインの実装。 運用環境を準備するためのジョブの実行。 スケーラブルな機械学習ソリューションの管理、デプロイ、監視。 この試験の受験者は、データ サイエンスにおいて以下を使用した知識と経験を持っている必要があります。 Azure Machine Learning MLflow

                                                                                  Microsoft Certified: Azure Data Scientist Associate - Certifications
                                                                                • LLMを活用した生成AIの評価(LLM as a Judge) | ネットワンシステムズ

                                                                                  前回はRAGの検索で、正しい文章を見つけてきているかの評価について書きました。今回は生成される文章に注目して、その評価方法を考えます。 ライター:荒牧 大樹 2007年ネットワンシステムズ入社し、コラボレーション・クラウド製品の担当を経て現在はAI・データ分析製品と技術の推進に従事。最近では次世代の計算環境であるGPU・FPGA・量子コンピュータに注目している。 LLMを活用した評価について LLMのシステムを構成する場合に、RAGであれば、文章検索の方法、Chunk Size、含めるDocumentの数、使用するLLMの種類等の様々な選択肢があります。質問(Prompt)に対して、理想的な回答を作っておき生成された文章と比較して定量的な評価が出来れば一番良い組み合わせを選択する事が出来ます。自然言語処理の世界では、従来は性能指標としてROUGEやBLUE等が利用されてきましたが2つの文章

                                                                                    LLMを活用した生成AIの評価(LLM as a Judge) | ネットワンシステムズ