LLMの性能評価指標としてのMMLU指標の概要・評価方法。内部ではプロンプトエンジニアリングとして0-shot Chain of Thoughtが使われている。

kiririmodekiririmode のブックマーク 2024/06/02 02:50

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~|こへもこ

    はじめにはじめまして、ウイングアーク1stのこへもこと申します。 今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解いていきたいと思います。 生成AI(Genera...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう