サクサク読めて、アプリ限定の機能も多数!
LLMの性能評価指標としてのMMLU指標の概要・評価方法。内部ではプロンプトエンジニアリングとして0-shot Chain of Thoughtが使われている。
kiririmode のブックマーク 2024/06/02 02:50
生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~|こへもこ[llm][ai][performance][promptengineering]LLMの性能評価指標としてのMMLU指標の概要・評価方法。内部ではプロンプトエンジニアリングとして0-shot Chain of Thoughtが使われている。2024/06/02 02:50
このブックマークにはスターがありません。 最初のスターをつけてみよう!
note.com/fair_panda69142024/06/02
はじめにはじめまして、ウイングアーク1stのこへもこと申します。 今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解いていきたいと思います。 生成AI(Genera...
1 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /
LLMの性能評価指標としてのMMLU指標の概要・評価方法。内部ではプロンプトエンジニアリングとして0-shot Chain of Thoughtが使われている。
kiririmode のブックマーク 2024/06/02 02:50
このブックマークにはスターがありません。
最初のスターをつけてみよう!
生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~|こへもこ
note.com/fair_panda69142024/06/02
はじめにはじめまして、ウイングアーク1stのこへもこと申します。 今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解いていきたいと思います。 生成AI(Genera...
1 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /