並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 66件

新着順 人気順

"AI Agent"の検索結果1 - 40 件 / 66件

"AI Agent"に関するエントリは66件あります。 AILLM人工知能 などが関連タグです。 人気エントリには 『CLINEに全部賭けろ』などがあります。
  • CLINEに全部賭けろ

    Cline を使い始めて2ヶ月ぐらい経った。 自分の直感として、Cline は真のイノベーションの入口であり、そして開けてはいけないパンドラの箱でもあったと思う。 ここでいう Cline は Cline型コーディングエージェントであり、広義には Devin / Cursor や Copilot Agent 等を含む話。だが、後述するように Cline でしか見えない世界がある。 その先の未来に、プログラマとしての自分はフルベットする、という話をする。 私たちが知っているプログラミングの終焉 大事なことは次の記事に全部書いてある。まずこれを読んでほしい。 (Google翻訳) Steve Yegge 氏は、置き換えられるのはジュニアおよび中級レベルのプログラマーではなく、新しいプログラミング ツールやパラダイムを受け入れず過去に固執するプログラマーであると指摘しています。 <略> これはプロ

      CLINEに全部賭けろ
    • やさしいMCP入門

      4/9(水) お昼にYouTubeでも解説します🙌 やさしいMCP入門 & 実践LT会(KAGと学ぼう!勉強会) https://kddi-agile.connpass.com/event/351600/

        やさしいMCP入門
      • 【超実践】CursorでPM業務を圧倒的効率化🔥|tocky | picon

        こんにちは!株式会社 picon CTO の tocky (@tttockllll) です。 (LINE で ChatGPT「AIチャットくん」をよろしくね!) さて PM の皆さん、こんなお悩みはありませんか? 漠然としたアイデアを言語化する時間がない いちいちドキュメントにまとめるのが手間 やることをタスクに落としてアサインするのが面倒 これらの課題を解決できるのが Cursor です。 Cursor は、AI エージェントを搭載したテキストエディタです。 エンジニア向けコーディング支援ツールとしてのイメージが強いですが、メモ帳としての利用・要件定義書の作成などももちろん可能です。ドキュメント作成の多い PM 業務に Cursor を導入することで、大幅な効率化が期待できます。 本記事を実践すると、以下のような雑なメモ書きから… このような Notion をサクッと 15 分くらいで作

          【超実践】CursorでPM業務を圧倒的効率化🔥|tocky | picon
        • browser-use やばいです - Qiita

          はじめに 語彙力なくてすみません、 browser-use は、「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。 プロンプトで与えられた指示どおりに動き、ほかの技術と比較しても精度が抜群に高いです。 早速試してみます。 実践 複数のECサイトから特定の商品価格を取得することを目標とする。 Python は 3.11 以上が必要です。

          • AIコーディングエージェント勉強会

            2025/3/25: AIコーディングエージェント勉強会 (プライベート開催) 資料のみ公開版として

              AIコーディングエージェント勉強会
            • Cursorエージェント講座 超入門+実践編 | ドクセル

              スライド概要 プロンプトやRuleなどのコピペが上の資料だとできづらいかと思うので、こちらのフォルダから別途ドキュメント形式のPDF資料(テキストがコピペできるPDF)を用意しました。こちらもあわせてどうぞ。 https://drive.google.com/drive/folders/18gKJn-Mrx_ij80IS4QrB5DXATynKW_Db?usp=drive_link --- 2025年3月30日(日) 13:00開始〜15:30終了 本講座は下記の人気記事をベースに、執筆者自身が口頭で解説する形式となります * [あなたの仕事に"AI秘書"を。ノンエンジニアでもOKなCursorエージェント超入門](https://note.com/miyatad/n/nae304a0024af) * [プロジェクト管理もストレスもAIがサポート! ノンエンジニアでもOKなCursorエー

                Cursorエージェント講座 超入門+実践編 | ドクセル
              • AIエージェントについてまとめてみた

                ・AIエージェントとはなにか? ・AIエージェントの現在地はどこか? ・AIエージェントに関連した注目技術トレンド ・AIエージェントの課題と今後

                  AIエージェントについてまとめてみた
                • 「MCP?聞いたことあるけど使ってない…😅」人向けに初歩から少し踏み込んだ内容まで解説

                  今回は一気に「MCPなにもわからない」から「MCP完全に理解した」に一気にレベルアップすることを目的に書いています。 そのために以下をモリモリに解説していきます。 ModelContextProtocol(MCP)とは? MCPがあることでできること MCPを実装するライブラリmodelcontextprotocolを使ってチュートリアル 実装のためのネゴシエーションや通信プロトコルの説明も踏まえてのチュートリアルです。 CursorへのMCPサーバーの登録方法 MCPがどのように動作してツールが使われるのか? FunctionCallingとの違い MCPって単語聞きすげてわからないままに嫌になっている人はこれを読むことで解放されてください。 ModelContextProtocol(MCP)とは? まずはイメージを見てもらうとわかりやすいと思います。 (https://modelcon

                    「MCP?聞いたことあるけど使ってない…😅」人向けに初歩から少し踏み込んだ内容まで解説
                  • Cline(Roo Code)を暴走列車にしたら4日間で数ヶ月分のコードが生成できた

                    アイコンが変わったerukitiです。最近はやりのgpt-4o image generationを使って、顔だけだったアイコンに全身が追加されました。2023年4月10日に初めてのLLMプロダクトの開発キックオフからもうすぐで二年です。rat yearなこの業界なんで、変化がめまぐるしすぎますね。 今回は、真に高速なAIコーディングのメソッドを確立するために、中規模くらいのコードをコーディングエージェントのみに書かせる実験をしています。コーディングエージェントはCline派生であるRoo Code(以後Rooと呼ぶ)を使っています。 ※完全に個人研究としてやっているため、会社のリソースは使っていません。 作っているものはコーディングエージェントのコアライブラリ + おまけのCLI 規模としては136ファイル・26410行(一時期30000行弱までいった) なぜコーディングエージェントを使っ

                      Cline(Roo Code)を暴走列車にしたら4日間で数ヶ月分のコードが生成できた
                    • 【完全比較】VS Code最強の3大AIアシスタント!Cline vs Roo Code vs CoolCline - Qiita

                      Cline : シンプルかつ導入しやすいオープンソースAI Roo Code : Clineを拡張し、UIや役割切替が充実 CoolCline : 機能総合版。自動承認やコスト管理などを備えた最上級仕様 それぞれの特色や目的に合わせ、最適なツールを選んでみてください。 以下では、それぞれの詳細を見ていきます。 (長い割に上部でまとまっているので、以降は興味のある方のみ読んでください。) 1. Cline(クライン) 概要 Clineは、VS Code上で動作するオープンソースのAIコーディングアシスタントです。 VS Code拡張機能としてインストールし、コマンドラインインターフェース(CLI)やブラウザ操作とも連携できます。 GitHub Copilotのようなコード補完とは異なり、プロジェクト全体を理解して複数ファイルにわたる修正やビルド・テスト実行まで自律的に行える点が強みです。 ま

                      • MCPで広がるLLM 〜Clineでの動作原理〜

                        この記事『Clineに全部賭ける前に 〜Clineの動作原理を深掘り〜』では、Clineの内部構造について解説しました。今回は、その中でも最近、特に注目されている機能の一つ、MCPについての概要、ならびにCline内部での実装方法について詳しく掘り下げていきます。 そもそもMCPとは MCP(Model Context Protocol)はClineやCursorなどといった、LLMを使用しているクライアントがMCPサーバーと連携するためのプロトコルです。広義的に、MCPとはそのプロトコルを使用したサービスのことを指します。 MCPサーバーとはクラウド上のサービスやローカルで立ち上げているサーバーなどのことです。LLMがこのサーバーと連携することで、Notionのファイル編集やSupabaseのデータベースクエリ、Cloudflareのステータスチェック、ローカルのファイル編集などが可能に

                          MCPで広がるLLM 〜Clineでの動作原理〜
                        • わざわざ言語化されないClineのコツ

                          これなに これを書いた後にClineが盛り上がってきたので、また書きたくなった。二番煎じをやめろ。 大枠では変わってないので軽めのTips集です。 前回から変わった点 一か月前(2025/2/3)に書いた時から状況が変わっている ハイブリッド推論モデルとして、Claude 3.7 Sonnetが公開(2/24) Clineのアップデート .clineignoreによる読み込み対象からの除外 @terminal, @gitによるコンテキスト理解の改善 MCP Marketplace mizchiさんの魂が震えた モデル選定(2025/03) 利用経験のあるモデルを主観的にランク付けしている。 Tier1(基本これでいい) Claude 3.7 Sonnet Tier2(サブ機) Claude 3.6 Sonnet Claude 3.5 Sonnet Gemini 2.0 Pro Tier3(

                            わざわざ言語化されないClineのコツ
                          • AIエージェント入門

                            最後に紹介しているハンズオン👇️ https://qiita.com/minorun365/items/85cb57f19fe16a87acff

                              AIエージェント入門
                            • 生成AIが人間の介在なしに自律的にソフトウェアテストを生成し実行、バグや脆弱性を発見してくれるAIテストエージェント「Spark」登場

                              生成AIが人間の介在なしに自律的にソフトウェアテストを生成し実行、バグや脆弱性を発見してくれるAIテストエージェント「Spark」登場 ドイツに本社を置き、コード分析ツールなどを提供するCode Intelligence社は、起動すればあとは生成AIが人間の介在なしに自律的にソフトウェアテストを生成し実行することで、対象となるソフトウェアのバグや脆弱性などを発見してくれるAIテストエージェント「Spark」を発表しました。 An exciting milestone in software security testing: ???? ???????????? ???????? ?????, ??? ?? ???? ????? ???? ????? ???? ??????? ????? ???????????! Read the PR: https://t.co/wfuautln8i#AI

                                生成AIが人間の介在なしに自律的にソフトウェアテストを生成し実行、バグや脆弱性を発見してくれるAIテストエージェント「Spark」登場
                              • 2025年はRAGの次にAIエージェントが来る

                                はじめに 2024年のAI界隈では「RAG」が一巡し、その可能性と限界が明確になってきました。最も顕著な点は「RAGは魔法の杖ではない」という認識の広がりではないでしょうか? RAGは確かに、既存の文書やデータを活用したAIの応答精度向上に貢献してきました。しかし、単純な質問応答を超えた複雑なタスクの実行や、動的な状況への適応には限界があることも明らかになっています。この限界を超えるための次のステップとして注目を集めているのが「AIエージェント」です。 OpenAIのCEOであるサム・アルトマンが「次のブレークスルーはエージェントだ」と発言していたり Anthropic社員がこのようなスピーチをしたりしています。 AIエージェントとは AIエージェントは、特定のタスクや目的のために設計された自律的なAIシステムです。たとえば、会議の参加者の予定を自動で調整して最適な時間を設定するAIアシス

                                  2025年はRAGの次にAIエージェントが来る
                                • あなたの仕事に“AI秘書”を。ノンエンジニアでもOKなCursorエージェント超入門|miyatti@エクスプラザ

                                  どうも!生成AIのプロダクト開発支援やってるエクスプラザの"生成AIエバンジェリスト"みやっちです!(Xのアカウントは @miyatti ) ざっくりいうと生成AIの「社会」推進を日々がんばっている人間です。 ※ 自己紹介と会社紹介的に入社エントリおいておきます 今回はノンエンジニア向けのCursor講座という内容で、記事をかかせていただきました!だいぶ長文ですけど、もしよければご参考にしていただければ! 0. はじめに ── そもそも“エージェント”って何?「AIエージェント」……最近、こうした言葉を耳にする機会が増えていませんか? ざっくり言えば、“AIが自分で考えて動いてくれる存在”を指します。たとえば「イベントの準備を任せたい」と伝えるだけで、必要なタスクリストを自動的に生成し、順番や優先度を決めて進行管理までやってくれるのがエージェントの魅力。まるでAI秘書のように、こちらの目的

                                    あなたの仕事に“AI秘書”を。ノンエンジニアでもOKなCursorエージェント超入門|miyatti@エクスプラザ
                                  • Model Context Protocol(MCP)とは?生成 AI の可能性を広げる新しい標準

                                    はじめに こんにちは。クラウドエースの荒木です。 ChatGPT や Claude などの生成 AI が日常生活やビジネスに浸透してきましたが、これらの AI の真価は外部システムと連携したときに発揮されます。しかし、この連携には大きな課題がありました。 これまで AI と外部システムを連携させるには、システムごとに個別の API 統合が必要で、認証方法やデータ形式、エラー処理など、細かな実装を繰り返す必要がありました。このような個別対応は開発効率を下げ、拡張性や保守性の面でも問題がありました。 そこで登場したのが「Model Context Protocol(MCP)」です。2024 年 11 月に Anthropic が発表したこのオープンプロトコルは、AI と外部システムの接続を標準化し、開発者の負担を大幅に軽減します。 この記事では、MCP の基本概念から実装方法、活用事例まで、技

                                      Model Context Protocol(MCP)とは?生成 AI の可能性を広げる新しい標準
                                    • GitHub Copilot:エージェントの覚醒

                                      Author Thomas Dohmke GitHub Copilotの新機能を発表:VS Code向けのエージェントモードを導入、Copilot Editsの一般提供を開始、SWEエージェントの初公開 2021年にGitHub Copilotを発表した際、私たちの目標は明確でした。それは、AIペアプログラマーがより良いコードを書く手助けとなり、開発者の生活をより快適にすることでした。GitHub Copilotの名前には、人工知能(AI)は開発者に取って代わるものではないという私たちの信念が反映されています。そしてAIは常に開発者の味方で、優秀な副操縦士のように、一人で操縦することもできます。例えば、プルリクエストのフィードバック、セキュリティ脆弱性の自動修正、課題の実装方法に関するブレインストーミングをしたりすることができます。 今日、私たちはGitHub Copilotをさらに強化、

                                        GitHub Copilot:エージェントの覚醒
                                      • 2025年の年始に読み直したいAIエージェントの設計原則とか実装パターン集

                                        関連リソース Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents 【論文紹介】LLMベースのAIエージェントのデザインパターン18選 基盤モデルを用いたAIエージェントの設計パターン The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey は、「AIエージェントのアーキテクチャ」について、シン

                                          2025年の年始に読み直したいAIエージェントの設計原則とか実装パターン集
                                        • Browser Useを用いたブラウザ操作の自動化AIエージェント | DevelopersIO

                                          python 01agent.py INFO [browser_use] BrowserUse logging setup complete with level info INFO [root] Anonymized telemetry enabled. See https://github.com/gregpr07/browser-use for more information. INFO [agent] 🚀 Starting task: 今日の運勢について教えて INFO [agent] 📍 Step 1 INFO [agent] 🤷 Eval: Unknown - No prior goal was set. INFO [agent] 🧠 Memory: No actions have been taken yet. Current task is to find tod

                                            Browser Useを用いたブラウザ操作の自動化AIエージェント | DevelopersIO
                                          • Mastraで作るAIエージェント入門

                                            MastraというAIエージェント開発フレームワークを使って、GitHubリポジトリを解析するエージェントを開発する方法を解説します。初心者でも理解できるように基本から応用まで丁寧に説明し、実践的なプロジェクトを通じてAIエージェント開発のスキルを身につけることができます。

                                              Mastraで作るAIエージェント入門
                                            • AIがブラウザを自動で操作。OpenAIのAIエージェント『Operator』登場。|ChatGPT研究所

                                              2025年1月24日、OpenAIはウェブ上のタスクを自動実行するAIエージェント「Operator」を公開しました。 ユーザー専用のリモートブラウザを使ってサイトを閲覧・操作し、さまざまなタスクを自動化できます。 現在はアメリカのProユーザー向けの研究プレビュー版として提供されており、OpenAIはユーザーからのフィードバックをもとに機能を改善しながら、将来的にはPlusやTeam、Enterpriseへの展開も検討されています。 「Computer-Using Agent(CUA)」とは?Operatorの中核にあるのが、新しいモデルである Computer-Using Agent(通称:CUA) です。 GPT-4oの視覚的能力と強化学習による推論力を組み合わせることで、 画面上のボタンやフォームといったグラフィカルユーザーインターフェイス(GUI)を解析し、マウスやキーボードとい

                                                AIがブラウザを自動で操作。OpenAIのAIエージェント『Operator』登場。|ChatGPT研究所
                                              • 月500ドルから始まる“AIチームメイト”との開発生活 〜Devinとの理想の開発プロセスを求めて〜

                                                ソフトウェア開発の現場では、AIを活用した開発支援ツールへの注目が年々高まっています。 (たぶん)1年ほど前はCursorを使っているエンジニアも今ほどは少なく、OpenAI DevDayでデモを行なったOpenAIのエンジニアがCursorをエディタとして利用していたことが話題になったのを覚えています。 そして、2024年12月についにリリースされた「Devin」は、AIチームメイトの名の通り、まるでチームの一員として自律的に動く点が特徴とされています。 https://devin.ai/ 弊社も検証のためにDevinをトライアルしていますが、新人エンジニアを育成するように少しずつタスクを与え、フィードバックを繰り返していくうちに、Devinがどんどん機能してくれるようになる――そんな“育成ゲーム”のような手応えを感じています。 本記事では、月500ドルという導入コストを見合う形で活用す

                                                  月500ドルから始まる“AIチームメイト”との開発生活 〜Devinとの理想の開発プロセスを求めて〜
                                                • アクセンチュアが生成AIを軸にした新執行体制を発表 「既にほぼ全社員がAIエージェントを活用、成果を出し始めている」 - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                                  シェア 129 ツイート 0 はてブ 223 アクセンチュア株式会社は新執行体制を発表し、生成AIビジネス含めた今後の注力領域に関する記者説明会を開催した。説明会の冒頭、同社の江川社長が登壇して、今後は更に「生成AI」に軸足を置くこと、社員に寄り添う「AIエージェント」(AIバディ)を開発し、既に同社ではほぼ社員全員が「AIエージェント」を活用していることを発表した。 アクセンチュア株式会社 代表取締役社長 江川昌史氏 同社は「生成AIはこれまでの技術に比べて、普及のスピード感がまったく異なり、今後も加速度的に普及していく」と強調。ビジネス環境が大きな変革期を迎えていることを肌で感じてのことだろう。 営業、生産、購買のAI同士が対話し、議論し、経営者や従業員を支援するのが、デジタルツイン・エンタープライズのコンセプト。同社内では既にほぼ全社員が「AIエージェント」を活用している。今後は別の

                                                    アクセンチュアが生成AIを軸にした新執行体制を発表 「既にほぼ全社員がAIエージェントを活用、成果を出し始めている」 - ロボスタ ロボスタ - ロボット情報WEBマガジン
                                                  • RAGで「AIエージェント」を使う手法まとめ

                                                    本記事では、RAGの性能を高めるための「Agentic RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何 この記事は、「AIエージェント」をRAGに取り入れた手法である「Agentic RAG」のサーベイ論文[1]について、日本語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。 本題 ざっくりサマリー Agentic RAG は、RAGの新しい手法です。この論文では、「RAGにAIエージェントを使っている」とはどういう状態なのか、どんなパターンがあるのかまとめられています。クリーブランド・ステート大学の研究者らによって、2025年1月に発表された論文です。 最近、「AIエージェント」が注目されてい

                                                      RAGで「AIエージェント」を使う手法まとめ
                                                    • 生成AIのAIエージェントを大手3社(AWS、Azure、Google Cloud)で徹底比較してみた - G-gen Tech Blog

                                                      G-gen の奥田です。当記事では、Amazon Web Services(AWS)、Microsoft Azure、Google Cloud(旧称 GCP)が提供するフルマネージドな AI エージェントサービスの比較を行います。 はじめに 当記事について AI エージェントとは ツールとは マルチエージェントシステムとは RAG と併用する効果 3社比較 前提条件 機能比較 料金シュミレーション 想定シナリオ AWS Azure Google Cloud 総評 AWS Azure Google Cloud 詳細の解説 Amazon Bedrock Agents(AWS)の詳細 構成図 プロダクト一覧 できること 対応モデル ツール 料金 Azure AI Agent Services(Azure)の詳細 構成図 プロダクト一覧 できること 対応モデル ツール 料金 Playbooks(G

                                                        生成AIのAIエージェントを大手3社(AWS、Azure、Google Cloud)で徹底比較してみた - G-gen Tech Blog
                                                      • Manus

                                                        Manus is a general AI agent that bridges minds and actions: it doesn't just think, it delivers results. Manus excels at various tasks in work and life, getting everything done while you rest.

                                                          Manus
                                                        • 色々なことをClineにやらせてみた - karaage. [からあげ]

                                                          AIエージェント 最近、LLMエージェントのイベントにゲストで登壇しましたが、流行りのAIエージェントに私も注目しています。 特に、最近よく使っているのがCline(Roo Code)というAIコーディングツールです。Clineの概要や、環境の構築方法・使い方に関しては以下記事にまとめました。 Clineは、もちろんコーディングに使っているのですが、ClineだとAIがVS Codeのターミナルを通じて、好きにコマンドを実行することができるので、実はコーディングだけじゃなくて、色々なことが出来て面白いです。 この記事では、Clineでコーディング含めて色々やらせてみた内容を簡単に紹介します。 コーディング タワーディフェンスゲームとか、一瞬で作ってデプロイしてくれます。 あとは、最近音楽ソフトもつくってYouTube配信とかもしています。 karaage.hatenadiary.jp マリ

                                                            色々なことをClineにやらせてみた - karaage. [からあげ]
                                                          • 「UIも自動化も後回し」: AIエージェント開発の実践的アプローチ - Algomatic Tech Blog

                                                            こんにちは、ネオセールスカンパニーCTOの菊池(@_pochi)です。 1月にリリースした 「アポドリ 」 は、大変ありがたいことに多くの反響をいただいています。本記事では、その開発を通じて得た、「作らない」ことが成功につながる理由 についてお話しします。 apodori.ai 本記事では、アポドリの開発を通じて学んだ、「いかに作らないか」という反直感的なトピックについて書いていきたいと思います。 AIエージェント開発で後回しにすべきもの 業務A、業務B、業務Cという連続する3つの業務からなる一連のワークフローを実行するエージェントの例を考えます。 AIエージェントは、上図のように人間の実行指示を受け、思考を伴う複数業務を遂行し、アウトプットを返します。図に示した要素の中で、アポドリの開発においてギリギリまで実装しなかった要素があります。それは以下の2点です。 操作画面 : 処理の進捗表示

                                                              「UIも自動化も後回し」: AIエージェント開発の実践的アプローチ - Algomatic Tech Blog
                                                            • 「Agentless」という最新手法。LLMの新しい使い方。

                                                              本記事では、最近流行りの「生成AIエージェント」に替わる「Agentless」(エージェントレス)という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何 この記事は、ソフトウェア開発自体を自動化する際の新しい手法「Agentless」の論文[1]について、日本語で簡単にまとめたものです。 今回も「そもそもAIエージェントとは?」については、知っている前提で進みます。確認する場合は、こちらの記事などをご参考下さい。 本題 ざっくりサマリー 最近、ソフトウェア開発で生成AIを使うことは当たり前になっています。(GitHub Copilot、Cursor、Devinなど、様々なツールがリリースされています。) 「AGENTLESS」は、ソフトウェア開発を自動化する、という文脈でLLMを使う際の、新しい手法

                                                                「Agentless」という最新手法。LLMの新しい使い方。
                                                              • Anthropicの定義する"AI Agent"を理解する

                                                                巷では「AIエージェント」のワードをよく見かける一方、何をAIエージェントと定義するのか自分もフワっとしていたので、2024年12月20日に公開されたAnthropicの「Building effective agents」の記事を読んでみました。 「AIエージェントの定義ははっきりと定まっていません」みたいな文言は方々で見ますが、各社がどういう見解でそのワードを使っているのか、なんとなく理解することはできます。 ちなみに、以下の「うたたね / Masaki Otsuki」さんの記事では各社がどのような位置付けとしているのかがまとまっており、私も勉強させていただきました。ありがとうございます。 ※本記事ではAnthropicの記事に焦点を絞り、記事の内容を元に記述しています。 エージェントとワークフローの違い ワークフロー: LLMとツールが事前定義されたコードのパスを通じて調整されるシス

                                                                  Anthropicの定義する"AI Agent"を理解する
                                                                • browser-useメモ

                                                                  browser-useについて調査する どういうものか ブラウザのデバッグプロトコルを使ってLLMで操作するpythonライブラリ Playwright API → Chrome DevTools Protocol (CDP) ClaudeのComputer useのスコープを狭めたものと理解できる 似たツールとしてMCPのPuppeteerサーバーがある→mcp/puppeteer モデル(LLM)の呼び出しにLangChain Modelのインターフェイスに依存することでマルチプロバイダ対応してる なのでLangChainで動くモデルに対応してる 結果的にLangChain風のAgentフレームワークのミニマムな実装になってる 何ができるの? ブラウザ操作を自動化してできることはできる Hugging Faceで特定のライセンスを持つモデルを検索し、その情報をファイルに保存する 求人情

                                                                    browser-useメモ
                                                                  • AIエージェント時代の可能性と実践 #AIエージェント_findy

                                                                    2025年3月4日に開催されたFindyさん主催「LayerX 名村さんに聞く!2025年AIエージェント時代の可能性と実践」で発表した資料です。 この資料を読んで、強く関…

                                                                      AIエージェント時代の可能性と実践 #AIエージェント_findy
                                                                    • PublickeyのIT業界予想2025。AIはプロンプトからエージェントへ、ソブリンクラウドに注目、RDBはスケーラブルが基本になるなど

                                                                      ChatGPTの登場からこれまでAIの活用は主流はチャット、すなわち「プロンプト」と呼ばれる自然言語による対話的な指示によって行うことでした。適切なプロンプトを考えて与えることがAIを活用するための大事なノウハウでした。 そうした中で、2024年後半からAIサービスを提供する主要各社はAIの新たなサービス形態として「エージェント」化を進めています。 何を持ってAIエージェントなのかは企業ごとに主張が異なるためAIエージェントの厳密な定義はありませんが、おおまかに言えば、あらかじめタスクやミッションを与えておくことで自律的にAIが作業や処理を行い、適切なタイミングで人間に結果を提供してくれる、というものです。 要するに、生成AIがさらに人間のスタッフのように働いてくれる、というわけですね。 例えばマイクロソフトは2024年10月、AIプラットフォーム「Copilot Studio」に、自律型

                                                                        PublickeyのIT業界予想2025。AIはプロンプトからエージェントへ、ソブリンクラウドに注目、RDBはスケーラブルが基本になるなど
                                                                      • AI-Agent時代のエンジニアの役割と野性

                                                                        2025.3.9 きのこカンファレンス2025

                                                                          AI-Agent時代のエンジニアの役割と野性
                                                                        • 人類は勝てない? ChatGPTで本格調査レポートを作成「deep research」を試した

                                                                            人類は勝てない? ChatGPTで本格調査レポートを作成「deep research」を試した
                                                                          • GitHub Copilot の Agent mode の勘所 - ANDPAD Tech Blog

                                                                            モンスターハンターワイルズの力の護符と守りの護符をいつの間にか取っていたものの、ずっとアイテムBOXの中に入れていて取り出さないとダメ、ということに HR 70 になってから気がついた柴田です。 今日は最近紹介記事をよく見かける AI Agent による自動コーディングについて実際に試してできたコードや感想についてご紹介します。 GitHub Copilot の Agent mode 勤務先のアンドパッドではエンジニア全員が GitHub の Copilot のビジネスプランを使用することができます。私も GitHub の Copilot を VScode から利用しており、同じようなコードの繰り返しなど、「ここでこういう処理を書いてほしいなあ」と想像したものと大体同じコードを補完してくれるので便利に使っています。 一方で Copilot Edits や最近 Preview で追加された

                                                                              GitHub Copilot の Agent mode の勘所 - ANDPAD Tech Blog
                                                                            • OpenAIの新しいマルチエージェント用フレームワークSwarmを試す|はち

                                                                              Google ColabでSwarmを試したのでまとめました。 1. SwarmOpenAIが新しくマルチエージェント構築のためのフレームワークを作り始めました。まだ実験的なフレームワークで、本番環境での使用を想定していないようで、今の所かなりシンプルな仕組みに見えます。 エージェントの調整と実行を軽量で、制御性が高く、テストしやすいものにすることに重点を置いているようです。 2. Google Colabで実行してみる2.1 実行準備ライブラリのインストール !pip install git+https://github.com/openai/swarm.gitOPENAI_API_KEYを環境変数として設定。(SwarmはOpenAI APIを使うので必要) import os from google.colab import userdata os.environ["OPENAI_A

                                                                                OpenAIの新しいマルチエージェント用フレームワークSwarmを試す|はち
                                                                              • browser-useの基礎理解

                                                                                はじめに 最近話題になっている browser-use について自己理解のために基本的なところをまとめてみます。 公式リポジトリはこちら browser-use とは? browser-use は、Python で作られた「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。具体的には、下記のような機能を提供しています。 ビジョン機能や HTML 抽出 ブラウザで読み込んだページの DOM(要素構造)を解析、スクリーンショットやテキスト情報を取得できます。 マルチタブ管理 自動で複数タブを開き、それぞれのタブを並行して操作できます。 カスタムアクション機能 たとえば「特定のファイルを保存」「データベースへ登録」「社内チャットに通知する」など、ユーザー独自のアクションを定義できます。 自己修正機能 操作が失敗したり、要素を見つけられなかったりした場合に、自分で修正

                                                                                  browser-useの基礎理解
                                                                                • frameworks - AI Agent Toolkit

                                                                                  A TypeScript-based framework by AI16z with ~60% market share. Features extensive multi-agent simulation capabilities, cross-platform social engagement, and a thriving community of 6,000+ GitHub stars. Leading framework for creating AI agents that handle trading, social interactions, and community management.

                                                                                    frameworks - AI Agent Toolkit

                                                                                  新着記事