記事へのコメント8

    • 注目コメント
    • 新着コメント
    stealthinu
    InstructGPTで人間のラベラーを使って強化学習させたのがブレークスルーだったんだな。知性はデータに宿っている。

    その他
    sayamatcher
    sayamatcher ChatGPTのコア技術はInstructGPT

    2023/04/03 リンク

    その他
    misshiki
    misshiki 快適に見られるように、slideshareにあったのを一部改訂してSpeakerdeckにアップロードしなおしたらしい。3ページ増えている。

    2023/03/29 リンク

    その他
    currypurin
    https://twitter.com/imai_eruel/status/1640647178984235008?s=46&t=P0ErHvc-CtQVcqiyeGSb5w

    その他
    hihi01
    12月の時点でここまで理解されていた方がいらしたと。後で全文読みます。

    その他
    hirorinya
    人の手が入った温かみを感じるよね

    その他
    TimerTan
    TimerTan 強化学習で使う人間のフィードバックを作るのに一体何人を雇ったのだろう、と思ってたけど、たった40人というのは驚いた。たった40人のフィードバックで世界の何億人が満足するモデルを作れるとは…

    2023/03/28 リンク

    その他
    mayumayu_nimolove
    暴走したりしないのかな

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    ChatGPT�人間のフィードバックから強化学習した対話AI

    東京大学の研究室内で,今井がChatGPTの知見を共有するために使用したスライド資料です. 特に以下のよ...

    ブックマークしたユーザー

    • burnworks2025/02/04 burnworks
    • threeMonths2025/02/02 threeMonths
    • chicken_kozo2024/10/16 chicken_kozo
    • grugrugru2024/10/16 grugrugru
    • truesoftware2024/10/16 truesoftware
    • miyohide2024/10/14 miyohide
    • cyber_snufkin2024/08/29 cyber_snufkin
    • gungen2024/08/25 gungen
    • kikiki-kiki2024/08/05 kikiki-kiki
    • kozai2024/06/23 kozai
    • yamastar2024/06/23 yamastar
    • techtech05212024/06/04 techtech0521
    • gyu-tang2024/05/10 gyu-tang
    • stealthinu2024/05/09 stealthinu
    • t_trad2024/03/02 t_trad
    • ktykogm2024/03/02 ktykogm
    • xmobile2024/03/02 xmobile
    • sc3wp06ga2024/03/01 sc3wp06ga
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む