並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 2 件 / 2件

新着順 人気順

mlflowの検索結果1 - 2 件 / 2件

  • MLflow LLM Evaluate で Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro との QA を評価する - Qiita

    MLflow LLM Evaluate で Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro との QA を評価するAWSAzureDatabricksMLflowLLM はじめに 株式会社NTTデータ デジタルサクセスソリューション事業部 で AWS や Databricks を推進している nttd-saitouyun です。 以下の記事で、Databricks から Amazon Bedrock の Claude 3.5 Sonnet、Azure OpenAI の GPT-4o、Google Cloud Vertex AI の Gemini 1.5 Pro を利用できるように設定してきました。 Databricks の Mosaic AI Model Serving Endpoint から Amazon Bedrock の LLM を利用する Datab

      MLflow LLM Evaluate で Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro との QA を評価する - Qiita
    • MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価 - Qiita

      MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価AWSDatabricksbedrockMLflowLLM はじめに 株式会社NTTデータ デジタルサクセスソリューション事業部 で AWS や Databricks を推進している nttd-saitouyun です。 MLflow LLM Evaluate で モデルサービングされた LLM を評価する記事を書きました。 今回は同じシナリオで、LLM-as-a-Judge による評価をしてみます。 マニュアルには OpenAI の GPT を使った評価が多いのですが、今回は、AWS で Databricks を使っている方に役立つように モデルサービングエンドポイントで接続している Amazon Bedrock / Cla

        MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価 - Qiita
      1