AIモデルの「Claude」を開発するAnthropicが、生命情報解析を行う研究分野「バイオインフォマティクス」におけるAIの能力を測定するベンチマーク「BioMysteryBench」を発表しました。科学分野におけるAIの性能をこれまで以上に効果的に測れるものと紹介されています。 Evaluating Claude’s bioinformatics research capabilities with BioMysteryBench \ Anthropic https://www.anthropic.com/research/Evaluating-Claude-For-Bioinformatics-With-BioMysteryBench Anthropicは「医師や弁護士になるためには試験があるが、科学者になるための試験は存在しない。同じ問題はAIにも当てはまり、科学分野のベンチマー

