記事へのコメント2

    • 注目コメント
    • 新着コメント
    misshiki
    misshiki “Reinforcement Learning for Language Models”の翻訳&要約記事。日本語で読めるのがありがたい。

    2023/04/25 リンク

    その他
    deejayroka
    deejayroka “「強化学習」では否定的なフィードバックも可能である点です。正式な学習理論の観点から見ると、両者の間には大きな違いがあり、否定的フィードバックの方がはるかに強力です”

    2023/04/24 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    大規模言語モデルのための強化学習|npaka

    以下の記事が面白かったので、軽く要約しました。 ・Reinforcement Learning for Language Models 1. は...

    ブックマークしたユーザー

    • yug12242023/04/29 yug1224
    • northlight2023/04/27 northlight
    • moo_san2023/04/26 moo_san
    • sakito09022023/04/25 sakito0902
    • ymzkey2023/04/25 ymzkey
    • misshiki2023/04/25 misshiki
    • takehikom2023/04/25 takehikom
    • dhesusan46492023/04/25 dhesusan4649
    • udon562023/04/25 udon56
    • p-baleine2023/04/25 p-baleine
    • deejayroka2023/04/24 deejayroka
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事