Large language models (LLMs) have demonstrated impressive capabilities in natural language understanding and generation, but the quality bar for medical and clinical applications is high. Today, attempts to assess models' clinical knowledge typically rely on automated evaluations on limited benchmarks. There is no standard to evaluate model predictions and reasoning across a breadth of tasks. To a
GoogleとDeepMindが医療に特化した大規模言語モデル「Med-PaLM」を公開、人間の医師より安全性に優れた回答を示す Google ResearchとDeepMind、医療領域に焦点を当てた大規模言語モデル(LLM)である、「Med-PaLM」を公開した。 Med-PaLMは、より正確性、そして特段の安全性が求められる医療分野において、有用な回答を生成することを目的としている。HealthSearchQAと、専門医試験、研究、消費者からの問い合わせをカバーする既存の6つの公開質問応答データセットを組み合わせたものだ。 医療関係者はもちろん、そうでない人でも、このMed-PaLMを利用することが可能だ。このプラットフォームは、様々なデータセットの配信を通じて、多肢選択式の質問に対応することができるという。 これらのデータセットは、NedQA, MedMCQA, PubMedQA,
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く