rindai87のブックマーク / 2023年8月9日

2023年8月9日のブックマーク (1件)

Google Colab での JP Language Model Evaluation Harness による日本語LLMの評価手順｜npaka
「Google Colab」での「JP Language Model Evaluation Harness」による日本語LLMの評価手順をまとめました。 1. JP Language Model Evaluation Harness「JP Language Model Evaluation Harness」は、Stability AI が作成されてる、日本語 LLM の評価コードです。 2. 評価データセット「JCommonsenseQA」と「JNLI」と「MARC-ja」と「JSQuAD」の4つのデータセットで評価しています 2-1. JCommonsenseQA「JCommonsenseQA」は常識的な推論能力を必要とする多肢選択式質問応答タスクのデータセットです。「CommonsenseQA」の日本語版になります。 2-2. JNLI「JNLI」は、前提文が仮説文に対して持つ推論関
rindai87 2023/08/09
llm
リンク
- 2023年8月11日
- 2023年8月9日
- 2023年7月30日