記事へのコメント9

    • 注目コメント
    • 新着コメント
    misshiki
    “J-RAGBenchでは、実用上でGeneratorが求めれられる能力を情報統合・推論・論理条件の解釈・表形式の解釈・回答拒否という5つの評価カテゴリに体系化し、それらの組み合わせを網羅した114問のデータセットを構築した。”

    その他
    TakayukiN627
    LLMは多様な組織から頻繁に新しいモデルが公開されており、RAGの実用上優れているモデル選定のニーズは高いです。したがって、RAGにおけるGenerator選定のための、実用上の能力評価は重要な課題であると言えます。

    その他
    narukami
    Qwen3 235B A22B Instruct優秀だな Gemini2.5はFlashの方がProより上になっちゃうんだ

    その他
    khtno73
    重要

    その他
    touhousintyaku
    2.5 pro...

    その他
    yossy_etf
    yossy_etf LLMは日進月歩なんだから、評価せずにまず業務で使わせてほしいけど、やっぱり上の人に説明する為に、こういうのが必要だからとてもありがたい。

    2025/10/05 リンク

    その他
    kojikoji75
    “実用上でGeneratorが求めれられる能力を情報統合・推論・論理条件の解釈・表形式の解釈・回答拒否という5つの評価カテゴリに体系化し、それらの組み合わせを網羅した114問のデータセットを構築”

    その他
    lenore
    lenore NotebookLMをRAG代わりにしたときの正答率の低さに納得

    2025/10/05 リンク

    その他
    coziro
    “ 図”

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    J-RAGBench:日本企業でRAGするときの落とし穴とは

    はじめに はじめまして。株式会社neoAIの研究開発組織 (neoAI Research) の山勇太です。 昨今、RAG(R...

    ブックマークしたユーザー

    • Kazuworks1242025/10/30 Kazuworks124
    • secondlife2025/10/11 secondlife
    • naggg2025/10/07 naggg
    • daitom2025/10/07 daitom
    • zu22025/10/07 zu2
    • e10kg2025/10/07 e10kg
    • sagami_spring2025/10/07 sagami_spring
    • BlueSkyDetector2025/10/07 BlueSkyDetector
    • yug12242025/10/06 yug1224
    • misshiki2025/10/06 misshiki
    • TakayukiN6272025/10/06 TakayukiN627
    • samurairodeo2025/10/06 samurairodeo
    • onori1082025/10/06 onori108
    • tosi292025/10/06 tosi29
    • cloudff62025/10/06 cloudff6
    • seasougame2025/10/06 seasougame
    • satokunya2025/10/06 satokunya
    • horiri0692025/10/06 horiri069
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む