タイトル「weave」を検索 - はてなブックマーク

weaveの検索結果1 - 1 件 / 1件

Weave と Elyza-tasks-100 でローカルLLMを評価する｜npaka

「Weave」と「Elyza-tasks-100」でローカルLLMの評価を試したので、まとめました。 1. Weave と Elyza-tasks-100「Weave」は、LLMアプリケーションの記録、実験、評価のためのツールです。「Weights & Biases」が提供する機能の1つになります。「評価関数」と「評価データセット」を用意するだけで、LLMの評価に必要な面倒な処理 (記録・集計など) をすべて肩代わりしてくれます。「Elyza-tasks-100」はElyzaが提供する指示チューニングモデル用の評価用データセットです。問題固有の採点基準の情報も含まれています。 2. 評価データセットの準備評価データセットの準備手順は、次のとおりです。 (1) 「Elyza-tasks-100」から「test.csv」をダウンロード。 (2) 以下のプロンプトテンプレートを作成。・pr

あとで読む

Weave と Elyza-tasks-100 でローカルLLMを評価する｜npaka

はてなブックマーク

検索対象

並び順

ブックマーク数

セーフサーチ

期間指定

絞り込み

ブックマーク数

期間

セーフサーチ

weaveの検索結果1 - 1 件 / 1件

Weave と Elyza-tasks-100 でローカルLLMを評価する｜npaka

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

検索対象

並び順

ブックマーク数

セーフサーチ

期間指定

絞り込み

検索対象

ブックマーク数

期間

セーフサーチ

weaveの検索結果1 - 1 件 / 1件

Weave と Elyza-tasks-100 で ローカルLLMを評価する｜npaka

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Weave と Elyza-tasks-100 でローカルLLMを評価する｜npaka