サクサク読めて、アプリ限定の機能も多数!
教師あり学習は言語モデルに嘘をつかせる可能性がある。このためOpenAIはGPTモデルの強化学習型チューニング(RLHF)に多くの努力を投じており、モデルが答えを知らない場合に回答を避けることを促している。
yamadar のブックマーク 2023/04/23 23:55
Reinforcement Learning for Language Models[AI][@ChatGPT][@OpenAI]教師あり学習は言語モデルに嘘をつかせる可能性がある。このためOpenAIはGPTモデルの強化学習型チューニング(RLHF)に多くの努力を投じており、モデルが答えを知らない場合に回答を避けることを促している。2023/04/23 23:55
このブックマークにはスターがありません。 最初のスターをつけてみよう!
gist.github.com/yoavg2023/04/23
rl-for-llms.md Reinforcement Learning for Language Models Yoav Goldberg, April 2023. Why RL? With the release of the ChatGPT model and followup large language models (LLMs), there was a lot of disc...
19 人がブックマーク・2 件のコメント
\ コメントが サクサク読める アプリです /
教師あり学習は言語モデルに嘘をつかせる可能性がある。このためOpenAIはGPTモデルの強化学習型チューニング(RLHF)に多くの努力を投じており、モデルが答えを知らない場合に回答を避けることを促している。
yamadar のブックマーク 2023/04/23 23:55
このブックマークにはスターがありません。
最初のスターをつけてみよう!
Reinforcement Learning for Language Models
gist.github.com/yoavg2023/04/23
rl-for-llms.md Reinforcement Learning for Language Models Yoav Goldberg, April 2023. Why RL? With the release of the ChatGPT model and followup large language models (LLMs), there was a lot of disc...
19 人がブックマーク・2 件のコメント
\ コメントが サクサク読める アプリです /