並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 28 件 / 28件

新着順 人気順

gemini api docs function callingの検索結果1 - 28 件 / 28件

  • プログラミング用途の生成AI関連ツールの評価 2025/04/14

    現時点で個人の感想です。流動的なので、明日にでも意見は変わってると思います。 モデル Claude-3.7-sonnet コーディング性能が圧倒的に良い。迷ったらとりあえずこれを使っておけばよい だいたい1ファイル1000行ぐらいが管理できる限界 Gemini 2.5 今なら無料で使える。今のうちに使い込んでクセを把握するといい。 巨大コンテキスト理解ができるので、「大量にコードを読んでちょっとだけコードを書く」つまり一般的な業務プログラミングに向いてる。 リリースから一週間は負荷が高くて不安定だったが、最近安定してきた さすがに単純なコーディング性能は Claude-3.7-sonnet に劣る deepseek-chat Cline で使うには遅すぎて役に立たない AIツール作るときの壁打ちに使っている。雑に巨大データ送りつけても安くて安心 コーディングエージェント/拡張 Cline

      プログラミング用途の生成AI関連ツールの評価 2025/04/14
    • LLMガードレールの活用法と役割を正しく理解する - GMO Flatt Security Blog

      TL;DR LLMガードレールはLLMの入出力を監視・制御する技術であり、LLMアプリケーションにおける様々な脅威への対抗策になります。しかし、あくまで役割は脅威の緩和・低減であるため、それぞれの脅威に対する根本的な対策をした上で、万が一の事故に備え文字通りガードレールとして導入する必要があります。 本文中では、RAGアプリケーションの利用する外部データベースにプロンプトインジェクションを引き起こすデータが存在し、LLMに対する入力として利用された場合、LLMガードレールで検知する例を紹介しています。しかし、根本的には外部データベースに悪意あるデータが登録されないよう対策すべきです。 このブログではLLMガードレールで対応できる脅威を実際に検証しながら整理し、適切なユースケースを議論します。 はじめに こんにちは、GMO Flatt Security株式会社所属のセキュリティエンジニア滝上

        LLMガードレールの活用法と役割を正しく理解する - GMO Flatt Security Blog
      • Coding Agentについてのまとめ (2026年1月)

        LLMによるコード補完の登場 (2021年) GitHub Copilotの登場 我々がよく知るLLMによる支援はまず GitHub Copilot から始まりました。これはGPT-3 (OpenAI Codex, 現在のCodexと名前が同じで本当にややこしい) をベースとしたコード補完システムで、タイピングをしていると自動的にその行の続きを予測してくれるものです autocompleteとの違い それ以前にもIntelliSenseのようなautocompleteがありましたし、より進歩したn-gramなどを用いたものはありましたが、LLMをベースとしたものはTabnine (Tabnineは初期はn-gramモデル) やCopilotからとなります チャットベースのコードアシストの時代 (2022-2023年) ChatGPTの登場 ChatGPT以降、チャットによる対話形式でコード

          Coding Agentについてのまとめ (2026年1月)
        • GitHub - modelcontextprotocol/servers: Model Context Protocol Servers

          Official integrations are maintained by companies building production ready MCP servers for their platforms. 21st.dev Magic - Create crafted UI components inspired by the best 21st.dev design engineers. 2slides - An MCP server that provides tools to convert content into slides/PPT/presentation or generate slides/PPT/presentation with user intention. ActionKit by Paragon - Connect to 130+ SaaS inte

            GitHub - modelcontextprotocol/servers: Model Context Protocol Servers
          • How I Use Every Claude Code Feature

            I use Claude Code. A lot. As a hobbyist, I run it in a VM several times a week on side projects, often with --dangerously-skip-permissions to vibe code whatever idea is on my mind. Professionally, part of my team builds the AI-IDE rules and tooling for our engineering team that consumes several billion tokens per month just for codegen. The CLI agent space is getting crowded and between Claude Cod

              How I Use Every Claude Code Feature
            • 型安全かつシンプルなAgentフレームワーク「PydanticAI」の実装を解剖する - ABEJA Tech Blog

              はじめに こちらはABEJAアドベントカレンダー2024 12日目の記事です。 こんにちは、ABEJAでデータサイエンティストをしている坂元です。最近はLLMでアプローチしようとしていたことがよくよく検証してみるとLLMでは難しいことが分かり急遽CVのあらゆるモデルとレガシーな画像処理をこれでもかというくらい詰め込んだパイプラインを実装することになった案件を経験して、LLMでは難しそうなことをLLM以外のアプローチでこなせるだけの引き出しとスキルはDSとしてやはり身に付けておくべきだなと思うなどしています(LLMにやらせようとしていることは大抵難しいことなので切り替えはそこそこ大変)。 とはいうものの、Agentの普及によってより複雑かつ高度な推論も出来るようになってきています。弊社の社内外のプロジェクト状況を見ていても最近では単純なRAG案件は減りつつあり、計画からアクションの実行、結果

                型安全かつシンプルなAgentフレームワーク「PydanticAI」の実装を解剖する - ABEJA Tech Blog
              • A Guide to Claude Code 2.0 and getting better at using coding agents

                Table of Contents Intro Why I wrote this post The Map is not the territory This post will help you keep up in general Lore time - My Love and Hate relationship with Anthropic Timeline My Codex era Anthropic Redemption Arc + Regaining mandate of heaven Why Opus 4.5 feels goooood This post is not sponsored Pointers for the technically-lite The Evolution of Claude Code Quality of life improvements in

                  A Guide to Claude Code 2.0 and getting better at using coding agents
                • 【インターンレポート】OpenAI Agents SDK (Python版) でコールセンター風音声対話型マルチエージェントデモを作ってみた(おまけ付き) - Insight Edge Tech Blog

                  目次 【インターンレポート】OpenAI Agents SDK (Python版) でコールセンター風音声対話型マルチエージェントデモを作ってみた(おまけ付き) はじめに 1.AIエージェント✖️音声 = 音声エージェント 1.1 普及してきたAIエージェントについて 1.2 音声エージェントの恩恵について考える 1.3 リアルタイム音声対話API・音声エージェント開発ツールの紹介 2. OpenAI Agents SDK (Python版)で作る音声対話型マルチエージェントツール 2.1 OpenAI Agents SDKとは 2.2 2種類の音声エージェントの構造 2.3 デモの紹介 2.4 今後の展望 おわりに 参考資料 はじめに こんにちは!!! Insight Edgeでアルバイトをしております、東京科学大学大学院 修士2年の田中です。大学院では、経営工学系の研究室で、サッカーの

                    【インターンレポート】OpenAI Agents SDK (Python版) でコールセンター風音声対話型マルチエージェントデモを作ってみた(おまけ付き) - Insight Edge Tech Blog
                  • AIエージェントは何から取り組む?社内取り組み紹介

                    こんにちは!AIソリューショングループの太田です。 このコラムでは最近ビジネスでの活用が注目されている生成AIエージェントについて気になっていはいるが、導入何から始めるべきか分からない方向けに、生成AIエージェントを使った問い合わせ対応の電通総研での取り組みを紹介します。 さらに、私たちが実際に生成AIエージェント開発を行った際の失敗談や工夫点も紹介しています。 みなさんの今後の開発や検証の参考になれば幸いです。 生成AIエージェントとは? そもそも生成AIエージェントとは、ユーザーの指示に対して、LLM(大規模言語モデル)が目的を達成するためのタスクを計画し、その計画によって自律的に実行するシステムです。 これまでも概念レベルでは論じられてきた技術ではありますが、ChatGPTをはじめとしたLLMの発展により複雑な指示に対しても、複数のタスクを組み立ててながらLLMが最適な計画を自律的に

                      AIエージェントは何から取り組む?社内取り組み紹介
                    • March 2025 (version 1.99)

                      Update 1.99.1: The update addresses these security issues. Update 1.99.2: The update addresses these issues. Update 1.99.3: The update addresses these issues. Downloads: Windows: x64 Arm64 | Mac: Universal Intel silicon | Linux: deb rpm tarball Arm snap Welcome to the March 2025 release of Visual Studio Code. There are many updates in this version that we hope you'll like, some of the key highligh

                        March 2025 (version 1.99)
                      • 音声AIの難しいところと音声AIエージェントフレームワーク「LiveKit Agents」の紹介 - tacomsテックブログ

                        こんにちは!株式会社tacomsのMorixです! 🎄 この記事はtacoms Advent Calendar 2025の8日目です! tacomsは飲食店向け電話注文受付AIエージェント「Camel AI Call」という音声AIプロダクトを提供しています。 www.camel-series.com このプロダクトを支えているのが音声AIエージェントフレームワークの「LiveKit Agents」です。今回は音声AIを作る難しさとそれをLiveKit Agentsでどのように解決するのかをご紹介します! 音声AIエージェントを作る上で難しいこと STT/LLM/TTSのパイプラインを作ること ユーザーの割り込み制御 各種APIのフォールバックの考慮 高速な応答速度の実現 ターン検出 セッションフルな通信の考慮 LLMのプロンプト定義やそのテスト 音声認識精度 イントネーション・発音 L

                          音声AIの難しいところと音声AIエージェントフレームワーク「LiveKit Agents」の紹介 - tacomsテックブログ
                        • Real-world gen AI use cases from the world's leading organizations | Google Cloud Blog

                          AI is here, AI is everywhere: Top companies, governments, researchers, and startups are already enhancing their work with Google's AI solutions. Published April 12, 2024; last updated October 9, 2025. Automotive & Logistics Business & Professional Services Financial Services Healthcare & Life Sciences Hospitality & Travel Manufacturing, Industrial & Electronics Media, Marketing & Gaming Public Sec

                            Real-world gen AI use cases from the world's leading organizations | Google Cloud Blog
                          • The next chapter of the Gemini era for developers- Google Developers Blog

                            We're giving developers the power to build the future of AI with cutting-edge models, intelligent tools to write code faster, and seamless integration across platforms and devices. Since last December when we launched Gemini 1.0, millions of developers have used Google AI Studio and Vertex AI to build with Gemini across 109 languages. Today, we are announcing Gemini 2.0 Flash Experimental to enabl

                              The next chapter of the Gemini era for developers- Google Developers Blog
                            • July 2025 (version 1.103)

                              Version 1.108 is now available! Read about the new features and fixes from December. Release date: August 7, 2025 Update 1.103.1: The update adds GPT-5 prompt improvements, support for GPT-5 mini, and addresses these issues. Update 1.103.2: The update addresses these issues. Downloads: Windows: x64 Arm64 | Mac: Universal Intel silicon | Linux: deb rpm tarball Arm snap Welcome to the July 2025 rele

                                July 2025 (version 1.103)
                              • Tool Calling with LangChain

                                TLDR: We are introducing a new tool_calls attribute on AIMessage. More and more LLM providers are exposing API’s for reliable tool calling. The goal with the new attribute is to provide a standard interface for interacting with tool invocations. This is fully backwards compatible and is supported on all models that have native tool-calling support. In order to access these latest features you will

                                  Tool Calling with LangChain
                                • Gemini API Additional Terms of Service  |  Google AI for Developers

                                  Terms of service Available regions Additional usage polices Gemini About Docs API reference Pricing Imagen About Docs Pricing Veo About Docs Pricing Gemma About Docs Gemmaverse Build with Gemini Gemini API Google AI Studio Customize Gemma open models Gemma open models Multi-framework with Keras Fine-tune in Colab Run on-device Google AI Edge Gemini Nano on Android Chrome built-in web APIs Build re

                                    Gemini API Additional Terms of Service  |  Google AI for Developers
                                  • Google Apps Script 新時代: 生成 AI と自然言語で拓く Google Workspace 自動化の未来

                                    Google Apps Script 新時代: 生成 AI と自然言語で拓く Google Workspace 自動化の未来 概要 本稿では、Google Apps Script (GAS) を AI 時代の統合ハブとして再定義し、Model Context Protocol (MCP) や Agent2Agent (A2A)、そして Gemini CLI エコシステムとの融合によって実現する Google Workspace 自動化の最前線を紹介します。ローカルとクラウドをつなぐデータ統合 (RAG) や、AI が生成した GAS を安全に実行するサンドボックス技術、さらには最新の Google Antigravity 上での自律エージェント連携までを網羅。自然言語による指示だけで複雑なワークフローが自律的に完結する、次世代のワークスタイルとその実装手法を探求します。 序論 人工知能(A

                                      Google Apps Script 新時代: 生成 AI と自然言語で拓く Google Workspace 自動化の未来
                                    • 『LangChainとLangGraphによるRAG・AIエージェント[実践]入門』は、LangChain/LangGraphを日本語で学習したい人にとって必携の一冊 part1 - Qiita

                                      Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Amazon 技術評論社 タイトル: LangChainとLangGraphによるRAG・AIエージェント[実践]入門 以降、「本書」と呼称します。 書評は二部構成です。 第一部の書評 OpenAIのチャットAPIとLangChainの基礎からRAGまで ここ 第二部の書評 AgenticなAIシステム と LangGraph 前置き LangGraphのお勉強してますアピールをしていると、ありがたいことに、著者の吉田さんから、ご恵贈いただきました。吉田さんと大嶋さん共著のChatGPT/LangChainによるチャットシステム構築[実

                                        『LangChainとLangGraphによるRAG・AIエージェント[実践]入門』は、LangChain/LangGraphを日本語で学習したい人にとって必携の一冊 part1 - Qiita
                                      • February 2025 (version 1.98)

                                        The feature is still in development and not yet ready for general use. View the experimental features (@tag:experimental). Copilot Edits Agent mode improvements (Experimental) Last month, we introduced agent mode for Copilot Edits in VS Code Insiders. In agent mode, Copilot can automatically search your workspace for relevant context, edit files, check them for errors, and run terminal commands (w

                                          February 2025 (version 1.98)
                                        • AI Engine

                                          説明 AI Engine seamlessly connects WordPress with the world’s leading AI models. Create intelligent chatbots, generate content, build AI forms, and automate tasks—all from your WordPress dashboard. You can create a chatbot to assist your visitors, answer support questions, or guide users through your products and services. Need fresh content? AI Engine can write posts in your voice, help rewrite exi

                                            AI Engine
                                          • GitHub - taishi-i/awesome-ChatGPT-repositories: A curated list of resources dedicated to open source GitHub repositories related to ChatGPT and OpenAI API

                                            awesome-chatgpt-api - Curated list of apps and tools that not only use the new ChatGPT API, but also allow users to configure their own API keys, enabling free and on-demand usage of their own quota. awesome-chatgpt-prompts - This repo includes ChatGPT prompt curation to use ChatGPT better. awesome-chatgpt - Curated list of awesome tools, demos, docs for ChatGPT and GPT-3 awesome-totally-open-chat

                                              GitHub - taishi-i/awesome-ChatGPT-repositories: A curated list of resources dedicated to open source GitHub repositories related to ChatGPT and OpenAI API
                                            • GitHub - langroid/langroid: Harness LLMs with Multi-Agent Programming

                                              This is just a teaser; there's much more, like function-calling/tools, Multi-Agent Collaboration, Structured Information Extraction, DocChatAgent (RAG), SQLChatAgent, non-OpenAI local/remote LLMs, etc. Scroll down or see docs for more. See the Langroid Quick-Start Colab that builds up to a 2-agent information-extraction example using the OpenAI ChatCompletion API. See also this version that uses t

                                                GitHub - langroid/langroid: Harness LLMs with Multi-Agent Programming
                                              • ChatGPTとは (チャットジーピーティーとは) [単語記事] - ニコニコ大百科

                                                ChatGPT単語 ニコニコ動画でChatGPTの動画を見に行く チャットジーピーティー 3.7万文字の記事 58 0pt ほめる 掲示板へ 記事編集 🧠 ChatGPTの正体を一言でいうと?🔍 正式名称と中身🔧 できること(例)🏗 どうやって作られてる?🤖 何がすごいの?⚠ 注意点(万能ではない)🎓 一言まとめ技術的な概要主な特徴活用例🧠 一言で言うと?📜 基本情報🔍 なぜ作られたの?🔧 主なプロダクトと技術🌐 他社との連携⚠ OpenAIが重視していること✨ 一言まとめ🔹OpenAIの設立経緯🔹OpenAIのミッション🔹主な製品と技術🔹OpenAIの影響🔹今後の展望📌 ユーザーエージェントとは?📌 なぜユーザーエージェントで回答が変わる?📌 ChatGPTでユーザーエージェントが影響するケースは?1. そもそも User‑Agent とは?2. な

                                                  ChatGPTとは (チャットジーピーティーとは) [単語記事] - ニコニコ大百科
                                                • How to write a good spec for AI agents

                                                  TL;DR: Aim for a clear spec covering just enough nuance (this may include structure, style, testing, boundaries) to guide the AI without overwhelming it. Break large tasks into smaller ones vs. keeping everything in one large prompt. Plan first in read-only mode, then execute and iterate continuously. “I’ve heard a lot about writing good specs for AI agents, but haven’t found a solid framework yet

                                                    How to write a good spec for AI agents
                                                  • Gemini 2.0 の APIのはじめ方|npaka

                                                    「Gemini 2.0」の APIのはじめ方をまとめました。 ・Gemini 2.0 (experimental) - Gemini API docs 1. Gemini 2.0 Flash「Gemini 2.0 Flash」は、「Gemini Developer API」と「Google AI Studio」を通じて、実験的なプレビューリリースとして利用できるようになりました。 このモデルの新機能は、次のとおりです。 ・Multimodal Live API ツールを使用してリアルタイムのビジョンおよびオーディオストリーミング アプリケーションを作成するのに役立ちます。 ・速度とパフォーマンス 「Gemini 1.5 Flash」とに比べて、最初のトークン生成までの時間  (TTFT) が大幅に改善されています。 ・品質 「Gemini 1.5 Pro」と比べて、ほとんどのベンチマークで

                                                      Gemini 2.0 の APIのはじめ方|npaka
                                                    • Gemma 4 model card  |  Google AI for Developers

                                                      Terms of use Gemma 4 license Prohibited use Intended use statement Gemini About Docs API reference Pricing Imagen About Docs Pricing Veo About Docs Pricing Gemma About Docs Gemmaverse Build with Gemini Gemini API Google AI Studio Customize Gemma open models Gemma open models Multi-framework with Keras Fine-tune in Colab Run on-device Google AI Edge Gemini Nano on Android Chrome built-in web APIs B

                                                        Gemma 4 model card  |  Google AI for Developers
                                                      • 生成AIの熱狂に向き合った1年と社内活用推進の振り返り

                                                        この記事は READYFOR Advent Calendar 2023 10日目の記事になります。 皆さんこんにちは。READYFOR でコーポレートエンジニアを担当している若林です。 READYFOR では、社内で利活用するITサービスの導入・活用や情報セキュリティを推進している立場にあります。 生成AIがもたらすコーポレートエンジニアリングの変化 世の中に衝撃を与えた ChatGPT の一般公開から1年が経ちましたね(早い…!) 生成AIの登場によりコーポレートエンジニアの業務も大きな影響を受けていると感じます。そしてその影響は、「GASやSQLを瞬時に生成できて業務効率化が加速するよね」というような単純な話では済まないと感じています。 というのも昨今のコーポレートエンジニアが担当する社内業務のITシステムは、ホリゾンタル SaaS の乱立によってコモディティ化が進んできていることもあ

                                                        • GitHub - ComfyUI-Workflow/awesome-comfyui: A collection of awesome custom nodes for ComfyUI

                                                          ComfyUI-Gemini_Flash_2.0_Exp (⭐+172): A ComfyUI custom node that integrates Google's Gemini Flash 2.0 Experimental model, enabling multimodal analysis of text, images, video frames, and audio directly within ComfyUI workflows. ComfyUI-ACE_Plus (⭐+115): Custom nodes for various visual generation and editing tasks using ACE_Plus FFT Model. ComfyUI-Manager (⭐+113): ComfyUI-Manager itself is also a cu

                                                            GitHub - ComfyUI-Workflow/awesome-comfyui: A collection of awesome custom nodes for ComfyUI
                                                          1