タグ

2024年5月13日のブックマーク (3件)

  • RAG評価ツール ragas を試す|npaka

    RAG評価ツール「ragas」を試したので、まとめました。 1. ragas「ragas」は、「RAG」 (Retrieval Augmented Generation) パイプラインを評価するためのフレームワークです。「RAG」は外部データを使用してLLMのコンテキストを拡張するLLMアプリケーションです。「ragas」はこのパイプラインを評価して、パフォーマンスを定量化します。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) RAGパイプラインの準備。 今回は、以下の記事で作成した、ELYZAのRAGパイプラインを使います。 (2) パッケージのインストール。 # パッケージのインストール !pip install ragas datasets(3) 環境変数の準備。 「ragas」は「OpenAI API」で評価します。 import os import

    RAG評価ツール ragas を試す|npaka
  • RAG評価フレームワークのragasを使ってみた - サーバーワークスエンジニアブログ

    サーバーワークスの村上です。 このブログではRAGの評価フレームワークであるragasについて紹介します。 ragasとは RAGの評価イメージ ragasでできること概要(忙しい方向けのまとめ) このブログで検証したこと ragasの利用の流れ テストデータの作成 RAGアプリケーションの回答を取得 評価 具体的な実装 テストデータの作成 htmlのロード LLMの定義 プロンプトのカスタマイズ テストデータの作成 生成できる質問の数 生成したテストデータをCSVに保存 RAGアプリケーションの回答を取得 評価 データセットを作成 メトリクスを定義 メトリクスの算出 まとめ ragasとは ragasはRAG(検索拡張生成)を評価するためのフレームワークです(RAG Assessmentが由来)。 github.com RAGとは大規模言語モデル(LLM)の外部に情報の保管場所を作ってお

    RAG評価フレームワークのragasを使ってみた - サーバーワークスエンジニアブログ
    arrowKato
    arrowKato 2024/05/13
    タイトル通り
  • https://moment-timeseries-foundation-model.github.io/

    arrowKato
    arrowKato 2024/05/13
    時系列のfoundation model うまくいくといいけど、やっぱり言語とか画像みたいな共通理解がテーブルデータにあるのかどうかは結構疑問。