タグ

PythonとAgenticAIに関するmkusakaのブックマーク (1)

  • Gemini 3 Flash の新機能 Agentic Vision の概要|npaka

    「Gemini 3 Flash」の新機能「Agentic Vision」の概要についてまとめました。 ・Introducing Agentic Vision in Gemini 3 Flash 1. はじめに「Gemini 3 Flash」の「Agentic Vision」は、画像理解を静的な行為からエージェント的なプロセスへと変換します。視覚を能動的な調査として扱います。「Agentic Vision」が最初にサポートしたツールの1つであるコード実行とVisual Reasoningを組み合わせることで、モデルは画像を拡大・検査・操作するための計画を段階的に策定し、視覚的な証拠に基づいて回答を導き出します。 「Gemini 3 Flash」でコード実行を有効にすると、ほとんどのVisionベンチマークにおいて一貫して5~10%の品質向上が実現します。 2. Agentic Vision:

    Gemini 3 Flash の新機能 Agentic Vision の概要|npaka
    mkusaka
    mkusaka 2026/01/29
    Gemini 3 FlashのAgentic Visionは、Pythonコード生成で画像を能動的に操作し、コード実行でほとんどのVisionベンチマークで一貫して5~10%の品質向上を実現します。
  • 1