Large language models can do jaw-dropping things. But nobody knows exactly why. コンピューター科学者は 大規模言語モデルをなぜ 「科学」するのか? 大規模言語モデルが破竹の勢いで成功を収めているにもかかわらず、こうしたモデルがうまく機能する仕組みや理由は、いまだによくわかっていない。コンピューター科学者たちは、その謎を解明することで次世代のAI技術の開発とリスク管理に生かしたい考えだ。 by Will Douglas Heaven2024.03.29 1 18 2年前、オープンAI(OpenAI)の研究者ユーリ・ブルダとハリー・エドワーズは、言語モデルに基礎的な算数をさせるには何が必要かを調べていた。2人は、2つの数を足し合わせる例題をいくつ見せれば、モデルは与えられた2つの数を足し合わせられるようになるのかを