タグ

2025年2月25日のブックマーク (5件)

  • 「Claude 3.7 Sonnet」と「Claude Code」が登場、OpenAI o1やDeepSeek-R1を超える性能で「ポケモン」のジムリーダーを3人倒すことに成功

    Anthropicが「Claude 3.7 Sonnet」を発表しました。Anthropicによれば、Claude 3.7 Sonnetは「市場初のハイブリッド推論モデル」で、ベンチマークではOpenAIのo1やo3-mini、DeepSeek-R1を超える性能を見せたとのことです。 Claude 3.7 Sonnet and Claude Code \ Anthropic https://www.anthropic.com/news/claude-3-7-sonnet Claude's extended thinking \ Anthropic https://www.anthropic.com/research/visible-extended-thinking Anthropicのいう「ハイブリッド推論モデル」とは、質問に対してすぐに答える「リアルタイムの回答」と、より推論を重ねた「

    「Claude 3.7 Sonnet」と「Claude Code」が登場、OpenAI o1やDeepSeek-R1を超える性能で「ポケモン」のジムリーダーを3人倒すことに成功
    pascal256
    pascal256 2025/02/25
  • Armの独自CPUデザインの市場参入でますます混沌となるPC/サーバー半導体市場 - 吉川明日論の半導体放談(329)

    最近米国の複数紙による「Armが独自の半導体チップの発売を計画か?」、との記事が話題になっている。従来Armは命令セットとコア設計のライセンス供与によるIPのビジネスモデルであったが、新たな戦略として自社独自設計チップによるデバイス市場への参入を計画しているという。新展開のこの構図はArmコアのライセンスを受ける幅広い顧客に対し自身が直接の競合になる可能性を示唆している。 スケーラブルで省電力のArmの優れた特徴 今回の報道では、すでにMETAとのCPU設計においての協力が進んでおり、サーバー用CPUが最初の製品になる模様だという。 AMDやIntelのCPUと比較して、Armの命令セットはRISC(Reduced Instruction Set Computer)風の簡素なものになっていて、マルチコア構造で省電力なCPUの設計に向いていることは確かだ。 昨今のAIサーバーセンターへの投資

    Armの独自CPUデザインの市場参入でますます混沌となるPC/サーバー半導体市場 - 吉川明日論の半導体放談(329)
    pascal256
    pascal256 2025/02/25
  • Claude 3.7 Sonnet と Claude Code の概要|npaka

    以下の記事が面白かったので、簡単にまとめました。 ・Claude 3.7 Sonnet and Claude Code 1. Claude 3.7 Sonnet と Claude Code の概要日 (2025年2月24日)、Anthropicはこれまでで最もインテリジェントであり、初のハイブリッドReasoningモデルである「Claude 3.7 Sonnet」を発表しました。「Claude 3.7 Sonnet」は、ほぼ瞬時の応答や、ユーザーに可視化される段階的な思考を生成することができます。API ユーザーは、モデルが思考できる時間を細かく制御することもできます。 「Claude 3.7 Sonnet」は、コーディングとフロントエンドWeb開発において特に大きな改善を示しています。モデルとともに、エージェントコーディング用のコマンドライン ツールである「Claude Code」も

    Claude 3.7 Sonnet と Claude Code の概要|npaka
    pascal256
    pascal256 2025/02/25
    開発ツールとしてのAIというところでポジションが確立してきたよね
  • Claude 3.7 Sonnet and Claude Code

    Today, we’re announcing Claude 3.7 Sonnet1, our most intelligent model to date and the first hybrid reasoning model on the market. Claude 3.7 Sonnet can produce near-instant responses or extended, step-by-step thinking that is made visible to the user. API users also have fine-grained control over how long the model can think for. Claude 3.7 Sonnet shows particularly strong improvements in coding

    Claude 3.7 Sonnet and Claude Code
    pascal256
    pascal256 2025/02/25
  • Devinの代替OSS OpenHandsを使ってみた|IORI

    最近Ubieにジョインした新人AIのDevin君が凄すぎて椅子から転げ落ちた😂 例えばテストコードを依頼する例。テスト実例・ルールと共にSlack上から作業を依頼した結果・・・ ・自動でPRを作成 ・CIがパスするまで修正を繰り返す ・PR上・Slack上・Devin上から修正依頼できる… pic.twitter.com/RrXgbwiTsE — 鹿野 壮 Takeshi Kano (@tonkotsuboy_com) December 25, 2024 ↑こういうことしてくれるAIエージェントね 個人で使うには価格が高い。まず使い始めるのに500ドル(7.5万円)払わないといけなくて、この500ドルはデポジットみたいなもんなのね。 この500ドルで250ACU(1ACUは15分の作業で消費)がチャージされるから60時間以上作業すると追加で従量課金しないといけない 1ドル150円として、

    Devinの代替OSS OpenHandsを使ってみた|IORI
    pascal256
    pascal256 2025/02/25
    おー、今度試そう