記事へのコメント6

    • 注目コメント
    • 新着コメント
    napsucks
    napsucks LLM A「こいつは無能です」LLM B「いえ、こいつの方が無能ですポンコツです」「なんだと!」「なにを!」→終末戦争へ

    2023/09/25 リンク

    その他
    qinmu
    qinmu 《LLM に LLM の評価そのものを行わせるという新たなアプローチ(LLM-as-a-judge)》

    2023/09/25 リンク

    その他
    stealthinu
    stealthinu 「LLM-as-a-judge」GPT4などの強力なLLMにLLMの性能を評価させる仕組み。Rakudaベンチなどがこれにあたる。評価問題どうしたらいいんだろう?と思ってたらまさに今ホットな分野なんだな。

    2023/09/25 リンク

    その他
    misshiki
    misshiki “LLM に LLM の評価そのものを行わせるという新たなアプローチ(LLM-as-a-judge)についてご紹介します。 ”

    2023/09/25 リンク

    その他
    Shinwiki
    Shinwiki もう英語3文字つけるのやめれ。

    2023/09/25 リンク

    その他
    t-wada
    t-wada 強力なLLM(例: GPT-4)にLLMの評価そのものをやらせるLLM-as-a-judge の解説と実践 "実際に運用する上では、単に出力の優劣を決めるだけではなく、さまざまな観点から出力を評価できるようなプロンプトを設計する必要がある"

    2023/09/25 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    LLMを用いたLLMの自動評価について 〜可能性と注意点〜 - NTT Communications Engineers' Blog

    こんにちは、イノベーションセンターの杉GitHub:kaisugi)です。普段はノーコードAI開発ツール Nod...

    ブックマークしたユーザー

    • techtech05212024/06/16 techtech0521
    • nakaoka32024/01/02 nakaoka3
    • cutc-mt2023/10/14 cutc-mt
    • mgl2023/10/02 mgl
    • sanko04082023/09/30 sanko0408
    • naggg2023/09/28 naggg
    • hush_in2023/09/28 hush_in
    • bzb054452023/09/27 bzb05445
    • yuiseki2023/09/27 yuiseki
    • nagatoshi09132023/09/26 nagatoshi0913
    • mayone-is2023/09/26 mayone-is
    • kwmr2023/09/26 kwmr
    • cyasufumi2023/09/26 cyasufumi
    • hiroomi2023/09/26 hiroomi
    • yug12242023/09/26 yug1224
    • bluescreen2023/09/25 bluescreen
    • hm_hs2023/09/25 hm_hs
    • ssmtkmt2023/09/25 ssmtkmt
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事