タグ

ClaudeとLLMに関するshirotorabyakkoのブックマーク (4)

  • 大規模言語モデルはエリート就活生を超えるか

    はじめに はじめまして、株式会社松尾研究所のきむ(@kangsoo_kim_)と申します。 松尾研究所で、さまざまなAIの社会実装の開発案件を手掛けてきたほか、金融に特化したチームの立ち上げなどを行ってきました。また、現在は経営戦略部という社内外の特命のPJTを推進するチームを統括しております。詳細については下記記事もどうぞ。 入社3年目で最速で役員へ。データサイエンティストが経験した松尾研での0→1の新規事業開発と今後の展望。 大規模言語モデルに対する素朴な疑問 大規模言語モデル(LLM)の進歩が目覚ましい昨今ですが、ふと疑問に思ったことがあります。 確かにLLMは知識はすごい。けど彼らは当に賢いと言えるのか。確率的に単語を予測しているだけで、当に高い推論能力・論理能力を得られているのだろうか。 そこで、ちょっとしたテストをしてみたいと思っていたところ、ふと外資系の就活をしていた学

    大規模言語モデルはエリート就活生を超えるか
  • 高木浩光@自宅の日記 - 速報:Claude 3に判例評釈を自動生成させてみた(Coinhive事件最高裁判決の巻)

    ■ 速報:Claude 3に判例評釈を自動生成させてみた(Coinhive事件最高裁判決の巻) 一昨日の「Claude 3に例の「読了目安2時間」記事を解説させてみた」の感触からすると、これだけLLMが長文の意味内容を「理解」するようになったとなると、もはや、書評や論文紹介、判例批評など、定形的なスタイルを持つ学術記事は、LLMによって自動生成が可能なんではないか?と思えてくる。 というわけでやってみた。土地勘のあるところで、Coinhive事件最高裁判例(刑集第76巻1号1頁)でやってみよう。しかし、さすがに、ただ最高裁の判決文を投入するだけでは、通り一遍の内容のない判例評釈になってしまうことが予想される。そこで、実在する一審の解説と二審の解説(私が書いたやつ)を読ませて、それを踏まえた最高裁判決の評釈を生成させてみる。これはうまくいくに違いない。たぶん。いや、どうかな。 さて結果は……

  • GPT-4を上回る性能で画像と文章を同時に処理できる日本語対応マルチモーダルAI「Claude 3」がリリースされる

    OpenAIエンジニアによって設立されたAIスタートアップのAnthropicが、大規模言語モデルの「Claude 3」を発表しました。 Introducing the next generation of Claude \ Anthropic https://www.anthropic.com/news/claude-3-family 以前のモデルである「Claude 2」は日語に対応しており、AIの日語能力を計測するベンチマークの「Rakuda」でOpenAIGPT-3.5を上回るスコアをマークしています。今回リリースされたClaude 3も複数言語対応で、GPT-4を上回る性能を持つとのこと。 Claude 3のモデルは安価でコスト効率に優れる「Haiku」、コストと性能をバランスさせた「Sonnet」、そして高価なものの高性能な「Opus」という3つのバリアントに分かれてい

    GPT-4を上回る性能で画像と文章を同時に処理できる日本語対応マルチモーダルAI「Claude 3」がリリースされる
  • 最近話題になった大規模言語モデルまとめ|npaka

    最近話題になった大規模言語モデルをまとめました。 1. クラウドサービス1-1. GPT-4「GPT-4」は、「OpenAI」によって開発された大規模言語モデルです。 マルチモーダルで、テキストと画像のプロンプトを受け入れることができるようになりました。最大トークン数が4Kから32kに増えました。推論能力も飛躍的に向上しています。 現在、「ChatGPT Plus」(有料版)で制限付きで利用できる他、ウェイトリストの登録者を対象に「OpenAI API」での利用も開始しています。

    最近話題になった大規模言語モデルまとめ|npaka
  • 1