タグ

ブックマーク / future-architect.github.io (10)

  • Prompt Flowをローカルで動かす&コードで管理する | フューチャー技術ブログ

    はじめにこんにちは、SAIG/MLOpsチームでアルバイトをしている板野です。 AzureのPrompt Flowをローカル環境で動かし、作成したフローをコードで管理する方法をご紹介します。 Prompt Flowとは、Azure Machine Learning上の機能で、Azure OpenAIで提供されているLLMを利用したアプリケーション開発を円滑にするためのツールです。 実際にLLMアプリケーションを開発する場合、「プロンプトを入力して終わり」ではなく、ベクトル検索など複数の要素を組み合わせることもあります。このため、Prompt Flowでは処理のフローをDAG(有向非巡回グラフ)で可視化することで、開発効率が大きく向上します。 Prompt FlowはPythonライブラリ(2023/09/27時点ではMITライセンス)として提供されており、Azureのコンソール画面だけでな

    Prompt Flowをローカルで動かす&コードで管理する | フューチャー技術ブログ
    misshiki
    misshiki 2024/02/13
    “AzureのPrompt Flowをローカル環境で動かし、作成したフローをコードで管理する方法をご紹介します。”
  • Python Distilledは幅広い人にPythonの基礎を叩き込む本 | フューチャー技術ブログ

    秋のブログ週間2023、3週目・13目です。 Python Distilledというがオライリーから出版されました。作者のDave Beazleyはかなり昔からPythonを使い込んでいる人ですので、このには信頼しかない、と思い読んでみました。Daveは大学の教授をしていて、コンピュータサイエンスで表彰もされている筋金入りです。家PyConでも何度も発表されているようです。Python歴は27年でOSSとしてはC/C++をラップして他の言語で使えるようにコードを生成するSWIGはすでに20年以上の歴史がありますし、パーサージェネレータのPLYとSLY。curioというコルーチンのライブラリなどを作っています。僕は以前、SWIGのドキュメント翻訳をしてCマガジンに特集記事を書かせていただいたこともあり、僕の大学時代の顔写真がSWIGのウェブサイトに公開されていたりします。 そういう世

    Python Distilledは幅広い人にPythonの基礎を叩き込む本 | フューチャー技術ブログ
    misshiki
    misshiki 2023/11/17
    “「async/awaitが入ったことで、ジェネレータが過去に必要とされた用途の一部はasync/awaitの方がよくなったよ」”
  • LLM開発のためにMLOpsチームがやるべきこと | フューチャー技術ブログ

    はじめにこんにちは、SAIG/MLOpsチームでアルバイトをしている板野・平野です。 今回は「LLM開発のためにMLOpsチームがやるべきこと」というテーマで、従来のMLOpsとの違い・ツール・構成例等について調査・整理しました。 LLMとはLarge Launguage Model(大規模言語モデル)の略であり、ここでのLLM開発とは、「LLM自体の開発」および「LLMを活用したシステム開発」の両方を含むものとします。LLM開発のフローについては以前にLLM開発のフローで詳細を説明しているので、ぜひ併せてご覧ください。 まず、MLOpsとは「機械学習モデルの実装から運用までを円滑に推進するための手法や考え方」のことです。AIの社会実装が増えるに伴い、MLOpsチームを設ける企業も増えてきました。また、最近ではLLMやその関連技術が急速に発達してきており、今後LLMを用いたアプリケーション

    LLM開発のためにMLOpsチームがやるべきこと | フューチャー技術ブログ
    misshiki
    misshiki 2023/09/13
    “「LLM開発のためにMLOpsチームがやるべきこと」というテーマでLLMのMLOpsに関連する部分を幅広くご紹介”
  • LLM開発のフロー | フューチャー技術ブログ

    はじめにこんにちは、SAIG/MLOpsチームでアルバイトをしている板野・平野です。 今回は、昨今注目されている大規模言語モデル(LLM)の開発においてMLOpsチームがやるべきことを考えるため、まずはLLM開発の流れを調査・整理しました。 記事はその内容を「LLM開発のフロー」という題目でまとめたものです。LLMを番運用するときに考慮すべきこと、LLM開発・運用を支援するサービスやツール・LLMシステムの構成例などについては、「LLM開発でMLOpsチームがやるべきこと」と題して別記事でご紹介していますので、ぜひ併せてご覧ください。 ここでのLLM開発とは、「LLM自体の開発」および「LLMを活用したシステム開発」の両方を含みます。また、「LLM自体の開発」は学習フェーズ、「LLMを活用したシステム開発」は推論フェーズ、として記載しています。 記事ではLLM開発における各フェーズの

    LLM開発のフロー | フューチャー技術ブログ
    misshiki
    misshiki 2023/09/13
    “「LLM開発のフロー」と題し、LLM自体の開発およびLLMを活用したシステム開発のフローをご紹介”
  • 書籍紹介:大規模データ管理(エンタープライズアーキテクチャのベストプラクティス) | フューチャー技術ブログ

    最近読んだ書籍の中で非常に良質な内容でしたので紹介したいと思います。少しでも多くの方に興味を持ってもらえることを期待しています。 O’Reilly Japan はじめに私自身がデータ管理(データマネージメント)という観点でここ数年様々な検討を行ってきていますので前提としてその背景について簡単にまとめてみます。 かつてオンプレミスで運用を行っていた時は企業内のデータは完全に管理されていました。データウェアハウスを導入してデータの集約・加工は行われていましたが、専門チームがデータ仕様確認やデータ提供までもすべての責任を担っていました。品質は高いのですが利用者からの要望(新しいデータの提供、仕様の変更)の対応についてはスピード大きな制約がありました。また大規模なデータを扱うためには多大なコストが必要という制約もあります。 クラウド技術による「スモールスタートを可能とするインフラ」「大規模なデータ

    書籍紹介:大規模データ管理(エンタープライズアーキテクチャのベストプラクティス) | フューチャー技術ブログ
    misshiki
    misshiki 2023/05/30
    “「大規模データ管理(エンタープライズアーキテクチャのベストプラクティス)」あるようにシステムアーキテクチャではなくエンタープライズ領域のデータマネージメントについて本質的な話をまとめてくれている良書”
  • MLシステムにおけるモデル・データの監視【概要編】 | フューチャー技術ブログ

    ツールの紹介Great Expectations概要Great Expectationsは、ユーザー独自のデータ品質テストの作成、テストの実行、テスト結果の可視化を可能とするOSS Pythonライブラリです。用意されているテストが豊富でデータの品質チェックに特化していることが特徴です(用意されているテスト一覧)。 監視できる項目例 Input Metrics 欠損値、各値が範囲内か、columnの増減、統計値が範囲内か、データドリフト/スキュー、外れ値など 詳細データの品質テスト(テストのことをexpectation)、エラーの文章化(html形式でどのテストをパスし、どのテストでエラーを起こしたかが見れる)、プロファイリング(統計量の計算)が可能となっています。 ※Great Expectations 公式Docsより画像引用 懸念点としては、モデル精度の監視や特徴量寄与率などのOut

    MLシステムにおけるモデル・データの監視【概要編】 | フューチャー技術ブログ
    misshiki
    misshiki 2023/04/20
    “モデル・データ監視について、監視の必要性、監視項目、ツールの紹介”
  • OpenAPI GeneratorでPython Web API構築 | フューチャー技術ブログ

    この記事はPython Advent Calendar 2022 カレンダー2の3日目です。昨日はtttakehさんのじゃんけん画像を分類してみたでした。 はじめにこんにちは。TIG DXユニットの村上です! さて、私の所属しているプロジェクトではバックエンドシステムに主にGo言語を用いており、Go言語によるWeb APIを構築しています。 例えばLambdaGoを使ったサーバーレスWebAPI開発実践入門など、Future Tech Blogには多くのノウハウが投稿されていますので是非ご覧になっていただければと思います。 今回はGo言語ではなくPythonでWeb APIを構築しました。その際にOpenAPI Generatorが便利だったのでご共有します。 OpenAPI GeneratorOpenAPI GeneratorはAPIリクエストやレスポンスの内容を定義し、それを元にプロ

    OpenAPI GeneratorでPython Web API構築 | フューチャー技術ブログ
  • Software Design 2021年11月号「Kaggleで知る機械学習」を寄稿しました | フューチャー技術ブログ

    はじめに TIGの玉木です。先日10月18日に発売されたSoftware Design 2021年11月号の第一特集、「Kaggleで知る機械学習 前処理から学習モデルの構築,スコアの上げ方までわかる」をフューチャーの農見、玉木、金子が担当しました。数日経ってしまいましたが、簡単に紹介させていただきます。 コンセプト以前の記事でも紹介しましたが、すでに世の中にはたくさんのKaggleを題材とした素晴らしい書籍があります。Kaggleは機械学習用のデータセット、実行環境が用意されており、機械学習を学ぶ題材として適しています。私達はまだあまり日語の書籍がないテーマである、 自然言語処理 画像処理 の2つの分野について、機械学習をこれから始めたい方向けに記事を書くことにしました。 雑誌という形態上ページ数が限られているのもありますが、なるべく最新の動向も含めつつ、最新の動向を理解するための最低

    Software Design 2021年11月号「Kaggleで知る機械学習」を寄稿しました | フューチャー技術ブログ
    misshiki
    misshiki 2021/10/27
    “まだあまり日本語の書籍がないテーマである、 自然言語処理 画像処理 の2つの分野について、機械学習をこれから始めたい方向けに記事を書くことにしました。”
  • scikit-learn 1.0 リリース!更新内容を一部紹介します。 | フューチャー技術ブログ

    こんにちは、TIG所属の玉木です。この記事はPython連載の7目の記事になります。 2021年9月24日にscikit-learn 1.0がリリースされました。私が大学院生のころ、scikit-learnのサンプルを動かすところから機械学習を勉強したので、ついに1.0かとなんだか感慨深い気持ちがあります(この記事で紹介しているPython 機械学習プログラミングです)。記事ではリリースから少し時間が経ってしまいましたが、リリースハイライト、チェンジログから、個人的に気になった以下の4つの内容を紹介しようと思います。 キーワード引数の強制 pandasのデータフレームからの特徴量名のサポート 新しいplot用のクラス追加 StratifiedGroupKFoldの追加 1. キーワード引数の強制scikit-learnの機械学習のモデルのクラス、メソッドは、多くの入力パラメータを持ちま

    scikit-learn 1.0 リリース!更新内容を一部紹介します。 | フューチャー技術ブログ
    misshiki
    misshiki 2021/10/11
    “キーワード引数の強制、 pandasのデータフレームからの特徴量名のサポート、 新しいplot用のクラス追加、 StratifiedGroupKFoldの追加”
  • 技育祭登壇しました。これから機械学習を学びたい方向けへの自分の経験談とおすすめの本、サイトの紹介もします | フューチャー技術ブログ

    技育祭登壇しました。これから機械学習を学びたい方向けへの自分の経験談とおすすめの、サイトの紹介もします TIGの玉木です。去年の12月までは主に機械学習エンジニアとして機械学習案件を任されていましたが、今年の1月からはITコンサルタントとして業務の幅が広くなりいろいろやっています。 先月技育祭 1と呼ばれるイベントの勉強会という枠で、同僚の上野さんと一緒に「初心者必見! 機械学習エンジニアがあれこれ話します。〜基礎から実社会応用まで〜」というタイトルで発表しました。この記事では技育祭の簡単な紹介と、当日あったこれから機械学習学びたい方向けへの、サイトの紹介をします。 技育祭とは公式サイト 1から引用させていただくと、 技育祭は「技術者を育てる」ことを目的としたエンジニアを目指す学生のための日最大のテックカンファレンスです とのことです。元2ちゃんねる管理人のひろゆきさんや、東京大学の

    技育祭登壇しました。これから機械学習を学びたい方向けへの自分の経験談とおすすめの本、サイトの紹介もします | フューチャー技術ブログ
    misshiki
    misshiki 2021/05/12
    “私がどうやって機械学習を学んだか”
  • 1