並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 183件

新着順 人気順

gemini flash api pythonの検索結果1 - 40 件 / 183件

  • 最近ローカルLLMがアツいらしい

    最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。 ローカルLLMって何じゃ?というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。 オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。 だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題 & OpenAIがAIベンチャー皆殺しにしてしまう問題 まず「結局GPTのAPIを叩いてサービス運営して成功し

    • AntigravityとGemini 3でアプリ開発したら、めちゃくちゃ効率的だった話

      こんにちは。SCSKの松渕です。 先日、発表されたばかりのGoogle Antigravityをインストール&簡易WEBサイト構築してみましたが、 今回はもう少しアプリ開発をしてみた実体験をブログに書きます! はじめに Antigravityとは AWSのKiroと同様に、AIエージェント型統合開発環境(Agentic IDE)と呼ばれるものです。 Antigravityのポイントとしては、特に以下の点になるかと思っております。 ・ AIによるブラウザ操作も可能 ・ AIによる自律的な実装 ・ アウトプット品質の高さ(これはGemini 3のポイントではありますが) ・ Google Cloud環境とのシームレスな連携 類似サービスとの比較は以下の通りです IDE/プラットフォーム 開発元 主な設計思想と特徴 類似サービスとの差別化ポイント Antigravity Google エージェン

        AntigravityとGemini 3でアプリ開発したら、めちゃくちゃ効率的だった話
      • Claude Code Skills × 投資分析シリーズ — 記事一覧

        Claude Code Skills を使って投資分析システムを構築・進化させてきたシリーズです。自然言語で話しかけるだけで、銘柄探索・分析・ポートフォリオ管理・リスク評価が自動実行されます。 シリーズの流れ スクリプトによる 自動化 から始まり、GraphRAG による 学習、高度な分析機能の追加を経て、6つの AI エージェントが自律的に連鎖する マルチエージェントオーケストレーション に到達。さらに Vol.5 では 4つの異なるAIが結論を反証し考え直す DeepThink を実装しました。 記事一覧 Vol.1: 株スクリーニングを自動化した話 テーマ: スクリプトで 自動化 Python × yfinance × Claude Code Skills で、株式スクリーニングからポートフォリオ管理まで投資分析を自動化。4つのスクリーナーエンジンとヘルスチェック機能を実装。 Vol

          Claude Code Skills × 投資分析シリーズ — 記事一覧
        • LLM推論に関する技術メモ

          はじめに BentoMLによるLLM Inference Handbookという、LLMの推論をまとめたハンドブックがある。本記事ではハンドブックや他の情報も参照しつつ、自分のメモ用としてLM推論に関する技術をまとめていく。 LLMの推論と内部理解の必要性 LLM推論とは、GPT-4、Llama 4、DeepSeek-V3などの学習済みLLMを使用して、ユーザーの入力から意味のある出力を生成することを指している。その推論には、たくさんの技術が抽象化・隠蔽されている。APIを利用している場合は、ほぼ意識せず活用できる。しかし、APIを何らかの理由で利用できない場合や、Open WeightなLLMを利用したい場合はこれらの技術を理解する必要がある。 実際、最適化されていない設定では、GPU時間で10倍のコストがかかることもある。ユーザー面であっても、最適化がされていなければ、応答速度が遅くな

            LLM推論に関する技術メモ
          • AIエージェント自作のための基礎知識 - 誰かの役に立てばいいブログ

            世は大 AI 時代ということで、調べ事や開発に様々な AI を利用するようになりました。 AI 失業だの SaaS is dead だのと騒がしいですが、そういうのは今日は置いておきます。 AI を使うのも良いですけど、せっかくソフトウェアエンジニアをやっているのですから、自分で作ってみるのもいいですよね。 結論から先に書いておくと、AIエージェントも今どきは簡単に自作できるようになっています。 この記事では Google 製の Agent Development Kit (ADK) を使いますが、何を使うにせよ、そもそも AI エージェントがどう動いているか理解しておかないと効率が悪いです。 それだって AI に聞けば出てくる、、わけですが、まあ人間が要点をまとめた記事にもまだ五円くらいは価値があるかなってことでまとめてみました。 ... お察しの通り、AI に指示して書かせたわけですけ

              AIエージェント自作のための基礎知識 - 誰かの役に立てばいいブログ
            • Google 公式ウェブ開発者向けリソースのご紹介

              .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                Google 公式ウェブ開発者向けリソースのご紹介
              • 日本語の手書きメモを書き起こせるOCRを探すために23モデルを片っ端から試した話

                こんにちは!逆瀬川ちゃん (@gyakuse) です! 今日は日本語の手書きメモをいい感じに書き起こしてくれるOCRを探して、23モデルを片っ端から比較してみた話をまとめていきたいと思います。 手書きメモは楽しいが電子化がつらい わたしはいまだに手書きメモをよく書きます。打ち合わせの最中にさっと書いたり、アイデアを整理するときにペンで図を描いたり。手を動かしながら考えるのはとても楽しいし、タイピングとは違う思考の広がり方があります。 ただ問題は電子化です。ノートに書いたメモをあとからSlackやNotionに転記するのがとにかくつらい。自分の字を自分で読み返す作業がすでにつらいのに、それを打ち直すのは二重苦です。 OCRで自動化したいのですが、日本語の手書き文字って既存のOCRモデルにとってはかなり難しいタスクです。活字ならどのモデルでも高精度ですが、手書きとなると精度がガクッと落ちます。

                  日本語の手書きメモを書き起こせるOCRを探すために23モデルを片っ端から試した話
                • BudouX: 読みやすい改行のための軽量な分かち書き器

                  .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                    BudouX: 読みやすい改行のための軽量な分かち書き器
                  • LLMガードレールの活用法と役割を正しく理解する - GMO Flatt Security Blog

                    TL;DR LLMガードレールはLLMの入出力を監視・制御する技術であり、LLMアプリケーションにおける様々な脅威への対抗策になります。しかし、あくまで役割は脅威の緩和・低減であるため、それぞれの脅威に対する根本的な対策をした上で、万が一の事故に備え文字通りガードレールとして導入する必要があります。 本文中では、RAGアプリケーションの利用する外部データベースにプロンプトインジェクションを引き起こすデータが存在し、LLMに対する入力として利用された場合、LLMガードレールで検知する例を紹介しています。しかし、根本的には外部データベースに悪意あるデータが登録されないよう対策すべきです。 このブログではLLMガードレールで対応できる脅威を実際に検証しながら整理し、適切なユースケースを議論します。 はじめに こんにちは、GMO Flatt Security株式会社所属のセキュリティエンジニア滝上

                      LLMガードレールの活用法と役割を正しく理解する - GMO Flatt Security Blog
                    • OpenAI o3, Claude 3.7 Sonnet , Gemini 2.5 Proの評価と解釈[2025年4月版] - Algomatic Tech Blog

                      こんにちは。Algomatic AI Transformation(AX) のsergicalsix(@sergicalsix)です。 最近OpenAI の o3, o4-mini、Anthropic の Claude 3.7 Sonnet、Google の Gemini 2.5 Pro や Gemini 2.5 Flash など、次々と新しい大規模言語モデル(LLM)が登場しました。あまりのスピードに、最新動向を追い切れず困っている方も多いのではないでしょうか。 モデルを選ぶ際は、実際に触ってみた使用感や解きたい課題・利用環境を重視するのが理想です。しかし、すべてのモデルをあらゆるシナリオで試すのは現実的に難しいです。 そこで役立つのが公開ベンチマークのスコアです。自分で全モデルを試せなくても、共通データセットで測った成績をベースラインとして押さえておけば、おおまかな実力を比較できます。

                        OpenAI o3, Claude 3.7 Sonnet , Gemini 2.5 Proの評価と解釈[2025年4月版] - Algomatic Tech Blog
                      • Antigravityで大人のLP開発

                        AI開発プラットフォーム「Antigravity」を使ってランディングページ(LP)を作成しようと思った際に、この辺に気をつけてやったよということを共有します。 LP開発に必要な前提知識 LPとはすなわちサービス(またはプロダクト)について知ってもらい、特定のアクション(お問合せ、資料請求、購読など)につなげるものです。つまりトップページと、何らかのアクション対象(たとえばお問合せフォーム)が必要になります。また、信頼性のあるサービスに見えるように、トップページ以外にページもあります。 (広義の)LP (狭義の)ランディングページ CTA(Call To Action)ボタン お問合せフォーム ページ3点セット(企業概要、プライバシーポリシー、特定商取引法に基づく表記) CTAボタンはヒーローセクション(ページ上部の一番目立つ部分)やヘッダーなどに置かれ、その気になったらすぐ問合せフォーム

                          Antigravityで大人のLP開発
                        • Google Password Manager のパスキーのセキュリティ

                          .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                            Google Password Manager のパスキーのセキュリティ
                          • Pythonで始めるマルチエージェントAI ―CrewAI入門 | gihyo.jp

                            杉田(@ane45)です。今月の「Python Monthly Topics」では、CrewAIを紹介します。 従来のLLM(大規模言語モデル)の活用は、単一のモデルに1つのプロンプトを投げて完結させる使い方が中心でした。しかし、複雑なタスクになると「調査→分析→執筆」のように役割を分けた方が効率的です。人間のチームと同じように、AIも役割分担することで品質が向上します。CrewAIは、このような「AIチーム」を簡単に構築できる軽量で高速なPythonフレームワークです。 CrewAIとは CrewAIは、複数のAIエージェントを役割ごとに編成し「チーム」として協力させ、複雑なタスクを自律的に実行させることができます。 公式ドキュメント(CrewAI Documentation) URL:https://docs.crewai.com CrewsとFlows CrewAIには中核となる2つ

                              Pythonで始めるマルチエージェントAI ―CrewAI入門 | gihyo.jp
                            • Google I/O の発表まとめ

                              tl;dr Google I/O 2025 でたくさんのサービスや機能が発表されたよ イベントに合わせて公開されたものはすべてひと通りまとめたよ 発表だけでまだ使うことのできないサービスも多いよ(アメリカ限定も多い) しばらく追記していくよ これはなに? Google I/O 2025 の発表をまとめたもの。開発者向けに限らず、よくばって発表内容をおおよそ網羅した(書きかけのため予定)ので、気になるところだけ読んでください。発表内容が豪勢で、悲しいかな、徹夜をしてしまったので、せっかくなのでみなさんの時短になれば&自分の覚え書きとしてまとめています。少しでも参考になれば幸いです。 こちらに今回の発表に関わる全 27 記事が一覧になっており、それらの中から押さえておくべき記事をかいつまんで簡潔にまとめます。 発表動画(Keynote)について 計約三時間の実況中継。場所はマウンテンビューの

                                Google I/O の発表まとめ
                              • Agent Development Kit 入門|npaka

                                「Agent Development Kit」のクイックスタートを試してみたので、まとめました。 ・Quickstart - Agent Development Kit 1. クイックスタート今回は、次のような天気と時間のToolを持つAgentを作成します。 (1) Pythonの仮想環境の準備。 今回は、「Python 10」を使いました。 (2) パッケージのインストール。 pip install google-adk(3) プロジェクトの作成。 以下のファイル構成で作成しました。 ・multi_tool_agent/ ・__init__.py ・agent.py ・.env ・__init__.py agentをインポートしました。 from . import agent・agent.py 1つのAgentと2つのToolを定義しました。 import datetime from

                                  Agent Development Kit 入門|npaka
                                • Chrome の User-Agent 文字列削減に関する最新情報

                                  .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                    Chrome の User-Agent 文字列削減に関する最新情報
                                  • 文系の非エンジニアだけどコーディングエージェントで自分用アプリ作った 超便利だけど超怖い「素人AI爆速開発」

                                    文系の非エンジニアだけどコーディングエージェントで自分用アプリ作った 超便利だけど超怖い「素人AI爆速開発」:「AIで試行錯誤」の現場から 昨今「AIエージェント」というワードが話題だ。記者が所属するITmedia NEWS/AI+でも頻繁に取り上げており、読者関心も高い。ITエンジニアの生産性や開発スピード、ひいてはビジネスの機動性に直結するからか、SNSなどでは特にコーディングを支援してくれるエージェントへの注目度が高いように感じる。 ……のだが、恥ずかしながら記者はエンジニアではなく、正直あまりついていけていない。ChatGPTとの対話形式でアプリ開発を試みたことも何度かあるものの、ごく簡単な機能以外は、恐らく自分の知識不足が原因で実現できておらず「まぁ非エンジニアならこんなもんか」とか思っていた。 しかし、2月末に登場したClaudeの最新モデル「Claude 3.7 Sonnet

                                      文系の非エンジニアだけどコーディングエージェントで自分用アプリ作った 超便利だけど超怖い「素人AI爆速開発」
                                    • ローカルLLMでzoltraakを動かせるか検証してみた

                                      はじめに どんな人向けの記事? ローカルLLMに興味のある人 zoltraakに興味のある方 LLMを用いて要件定義書を作りたい方 内容 今回は元木さんのZoltraakを使って、自然言語から要件定義書を作ってみようと思います。 ただし、リリースされてから2ヶ月以上経ったzoltraakを普通に動かすだけでは面白くないので、この記事ではローカルLLMを使った場合にどの程度の品質のアウトプットが得られるか、そもそもまともに使えるのかを検証してみたいと思います。 結論 結論から述べると、下記の通りになりました。 現状のローカルLLMだけでzoltraakを完全に動作させるのは難しそう。 要件定義書は問題なく作成できる。 その後の工程の、ディレクトリ・ファイル構成を作成するための実行可能なpythonコードを作ることができなかった。 grimoiresの記載を工夫することで、ある程度は改善できる

                                        ローカルLLMでzoltraakを動かせるか検証してみた
                                      • Bet PR-Agent 〜全自動コードレビューの夢〜 - LayerX エンジニアブログ

                                        はじめまして、LayerX バクラク事業部 Platform Engineering 部 Enabling グループに新卒入社した shibutani と申します。バクラクでは自動コードレビューツールとして2023年からPR-Agentを導入しています。 しかし、導入から約2年が経過した現在、多くの開発者がPR-Agentのコメントを十分に活用できていないという課題に直面しています。その大きな要因として、導入後に十分なカスタマイズが行われていないため、各チームのコーディング規約やプロダクトに関する知識に基づいた適切な指摘がなされていない点が挙げられます。 また、昨今ではGitHub Copilot code reviewが登場し、自動コードレビューを取り巻く状況は変化しつつあります。 そこで、本ブログでは、GitHub Copilot code reviewとの比較に加え、より効果的な運用

                                          Bet PR-Agent 〜全自動コードレビューの夢〜 - LayerX エンジニアブログ
                                        • Chrome の User-Agent 文字列削減のオリジン トライアルと今後の計画について

                                          .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                            Chrome の User-Agent 文字列削減のオリジン トライアルと今後の計画について
                                          • Rust製MCP対応AIエージェント『Goose』の技術概要 - laiso

                                            Gooseとは何か block.github.io BlockのAIチームが開発していたAIエージェント「Goose」が先日公開された。 これは、Rustで書かれたコマンドラインとウェブサーバーのコアモジュール、それを呼び出すElectron製のデスクトップアプリという構成になっている。 ユーザーは対話型シェルやデスクトップアプリのチャットUIを通じて、Cline*1やOnlook*2のようにローカルファイルを編集しながらコーディングをアシストしてもらう。 12月時点ではコアがPythonで書かれていたが、ベータリリース時にRustで書き直された。どうやらユーザー環境にPythonをインストールしてもらう必要があるのを避けたかったようだ*3。 github.com Gooseのコントリビューターなんか大人数で作っている・・ Gooseの目新しい点は、VS Codeなどのエディタから独立した

                                              Rust製MCP対応AIエージェント『Goose』の技術概要 - laiso
                                            • GoogleのLLM「Gemini」でコードレビューをするGitHub Actionsを自力で構築してみた - NTT docomo Business Engineers' Blog

                                              ビジネスdアプリ開発チームの立木です。現在、私たちのチームでは生成AIによる開発効率の向上を検討しています。その一環として、コードレビューの自動化を検討しています。 そこで、本記事では検証の一環として勉強も兼ねて、GoogleのLLM「Gemini」でコードレビューをするGitHub Actionsを自力で構築してみたのでその方法を紹介します。 Geminiとは Google AI Studio Vertex AI Google Gen AI SDK 着想の背景 コードレビューの観点 完成したもの ファイルの構成 処理の流れ gemini-code-review.yml gemini_review_code.py プロンプト 終わりに Geminiとは Geminiとは、Googleが提供しているLLMです。つい先日も、Gemini 2.5 proがリリースされ、コーディング能力を含め、そ

                                                GoogleのLLM「Gemini」でコードレビューをするGitHub Actionsを自力で構築してみた - NTT docomo Business Engineers' Blog
                                              • GitHub - modelcontextprotocol/servers: Model Context Protocol Servers

                                                Official integrations are maintained by companies building production ready MCP servers for their platforms. 21st.dev Magic - Create crafted UI components inspired by the best 21st.dev design engineers. 2slides - An MCP server that provides tools to convert content into slides/PPT/presentation or generate slides/PPT/presentation with user intention. ActionKit by Paragon - Connect to 130+ SaaS inte

                                                  GitHub - modelcontextprotocol/servers: Model Context Protocol Servers
                                                • ローカルLLMの検索ツールとして Gemini 2.5 Flash-Lite を試す|npaka

                                                  ローカルLLMの検索ツールとして「Gemini 2.5 Flash-Lite」を試してみたのでまとめました。 1. ローカルLLMに検索能力を与えてみる「日本語ローカルLLM」の性能は、ここ最近で一気に上がりました。しかし、パラメータサイズが10B以下だと、持ってる知識が限られるため、検索能力がほしくなります。 ローカルLLMに検索能力を与えるMCPは、次のとおりです。 ・Brave Search MCP 公式MCPが提供されている。 月間約1,000リクエストまで無料 ・Google Custom Search MCP 公式APIで信頼性高い。 1日100リクエストまで無料 ・Tavily MCP LLM向けに設計された検索API エージェント用途に相性が良い ・DuckDuckGo MCP 導入は簡単 ただし非公式実装が多く、長期安定性はやや不安 ・SearXNG MCP 自己ホスト可

                                                    ローカルLLMの検索ツールとして Gemini 2.5 Flash-Lite を試す|npaka
                                                  • Gemini Advancedを1ヶ月間使ってみた感想 - laiso

                                                    これまでメインで使うAIチャットをChatGPT Plus、Claude Proと順番に乗り換えてきました。なので今月はGoogleのGemini Advancedを1ヶ月間使ってみたので、その感想を書いてみます。 gemini.google Gemini Advancedの特徴 Gemini Advancedにすると現最上位モデルのGemini 1.5 Proが使えます。Gemini 1.5 Proは、Googleによると既存のモデルよりコーディング、論理的推論、ニュアンスの異なる指示に従うことなどの複雑なタスクを処理する能力が大幅に向上しているとされています。また100万トークンのコンテキスト・ウィンドウ(Large Context Window)で長文が読解できます*1。 無償版は画像のみアップロード可能ですが、Gemini AdvancedではテキストやPDFも対応しています。コン

                                                      Gemini Advancedを1ヶ月間使ってみた感想 - laiso
                                                    • 最近作ってる地味LLMコマンドラインツールたち: site2pdf, askrepo - laiso

                                                      地味LLMコマンドラインツールとは ここでいうLLMツールとは、モデルのインプットとアウトプットを繋ぐ「グルーコード」として機能するプログラムのことです。 筆者が現在開発しているツールもLLMをベースにして、従来の作業をより簡便にすることを目的としています。 このツールは単独で完結する価値を持つというよりも、他のツールと組み合わせることでその真価を発揮します。 そのため、外見的には派手さがなく、地味な存在といえるでしょう(コマンドラインツールがそもそも地味の代名詞でありますが)。 例えば、アプリのソースコードを自動生成するような華やかなツールがある一方で、バックエンドで静かにデータを整形するだけの地味なライブラリも存在しているのです。 Gemini系モデルの良いところ ツールの共通点としては意外とGemini系モデルを活用しています。 Geminiの特徴の一つは、その「トークン長」、つまり

                                                        最近作ってる地味LLMコマンドラインツールたち: site2pdf, askrepo - laiso
                                                      • Gemini 1.5 のロングコンテキストを活かして AI を育てるアプローチ 〜 RAG の限界を軽やかに突破するために

                                                        Gemini 1.5 のロングコンテキストを活かして AI を育てるアプローチ 〜 RAG の限界を軽やかに突破するために はじめに この記事では、Gemini 1.5 のロングコンテキストを活かして LLM を用いた AI システムを段階的に育てるアプローチを説明します。後半では、RAG システムの導入ハードルを下げるためにこのアプローチを適用するイメージをサンプルコードとあわせて紹介します。 ここではまず、前提知識となるグラウンディングや RAG の仕組みを説明します。 グラウンディングと RAG の違いについて LLM の業務活用に向けて勉強していると、かならず耳にするのが「グラウンディング」や「RAG」というキーワードです。グラウンディングは、LLM の基盤モデル自身が保有していない(学習していない)追加の参考情報をプロンプトに埋め込む事で、参考情報に基づいた回答を生成させるテクニ

                                                          Gemini 1.5 のロングコンテキストを活かして AI を育てるアプローチ 〜 RAG の限界を軽やかに突破するために
                                                        • [2025年6月27日] Gemini CLIは現状ちょっとダメかもしれない (週刊AI)

                                                          こんにちは、Kaiです。 いやぁGemini CLI(GC)来ましたね。早すぎです。スラッシュコマンドの作りとかを見ても、Claude Code(CC)をベンチマークにして作ったのは明らかだと思いますので、基盤レベルのAIプロダクトが流行ったら、1ヶ月程度でコピーされる世界観だと思った方がいいですね。 さてGemini CLI、まだ十分ではありませんがとりあえず触り始めています。ドキュメントとテストを整備して、TDD準備を終えた状態のサンドボックスプロトタイプリポジトリを与え、自走させて完成できるかというPoCをやってみました。以下はその感想です。 Gemini CLI Claude Code GCはとにかくコンテクストウィンドウが大きいので、1タスクをめちゃくちゃ詰め込めます。その一方で、TDDだと言ってるのに、テストがいつまでも通らないとテスト自体を破壊してゴールポストを動かそうとした

                                                            [2025年6月27日] Gemini CLIは現状ちょっとダメかもしれない (週刊AI)
                                                          • BigQueryとGeminiの連携で広がるSQLの世界 | 株式会社プリンシプル

                                                            近年、生成AIの活用が企業のデータ分析において重要なトレンドとなっています。その中で、BigQueryが提供する”ML.GENERATE_TEXT”関数は、データベースとAIの融合という新しい可能性を開きました。 この関数を使うには「存在そのものがあまり知られていない」「使い方が難しい」「利用するためには別途”BigQuery ML リモートモデル”を作成する必要がある」というハードルがあります。そのため、あまり使われていない印象です。 しかしながら、この”ML.GENERATE_TEXT”関数はとても強力です。本記事では、「この”ML.GENERATE_TEXT”関数で何ができるのか?」「どのように活用するのか?」「利用方法と注意点」を解説していきます。 ML.GENERATE_TEXT関数で何ができるのか? “ML.GENERATE_TEXT”関数は、BigQueryのSQLクエリを介

                                                              BigQueryとGeminiの連携で広がるSQLの世界 | 株式会社プリンシプル
                                                            • SBOM in Action: 「ソフトウェア部品表」で脆弱性を見つける

                                                              .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                                SBOM in Action: 「ソフトウェア部品表」で脆弱性を見つける
                                                              • Google は皆さんが使わなくなったアカウントも保護しています

                                                                .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                                  Google は皆さんが使わなくなったアカウントも保護しています
                                                                • GeminiのURL context toolを解説。スクレイピングなしでWebコンテンツを取得 - G-gen Tech Blog

                                                                  G-genの杉村です。Vertex AI の API 経由で Gemini を呼び出す際に、URL context tool を使って、明示的にスクレイピングをしなくても Web サイトの内容を取得してコンテキストとして利用する方法について解説します。 概要 URL context tool とは ユースケース サポートされているモデル 使用方法 URL context tool の検証 tools 不使用時との比較 Google Search tool との比較 Google Search tool との併用 概要 URL context tool とは URL context tool とは、Vertex AI の API 経由で Gemini を呼び出す際に、Web サイトの内容を取得してコンテキストとして利用できるようになるツールです。 本来、外部 Web サイトの内容を生成 AI

                                                                    GeminiのURL context toolを解説。スクレイピングなしでWebコンテンツを取得 - G-gen Tech Blog
                                                                  • Core Web Vitals によるビジネス インパクト

                                                                    .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                                      Core Web Vitals によるビジネス インパクト
                                                                    • 型安全かつシンプルなAgentフレームワーク「PydanticAI」の実装を解剖する - ABEJA Tech Blog

                                                                      はじめに こちらはABEJAアドベントカレンダー2024 12日目の記事です。 こんにちは、ABEJAでデータサイエンティストをしている坂元です。最近はLLMでアプローチしようとしていたことがよくよく検証してみるとLLMでは難しいことが分かり急遽CVのあらゆるモデルとレガシーな画像処理をこれでもかというくらい詰め込んだパイプラインを実装することになった案件を経験して、LLMでは難しそうなことをLLM以外のアプローチでこなせるだけの引き出しとスキルはDSとしてやはり身に付けておくべきだなと思うなどしています(LLMにやらせようとしていることは大抵難しいことなので切り替えはそこそこ大変)。 とはいうものの、Agentの普及によってより複雑かつ高度な推論も出来るようになってきています。弊社の社内外のプロジェクト状況を見ていても最近では単純なRAG案件は減りつつあり、計画からアクションの実行、結果

                                                                        型安全かつシンプルなAgentフレームワーク「PydanticAI」の実装を解剖する - ABEJA Tech Blog
                                                                      • Gemini2.0とStreamlitでお手軽なグラウンディング搭載の生成アプリ作成|masa_kazama

                                                                        この記事では、プロタイプ作成が簡単にできるPythonのStreamlitを用いて、Google検索を組み込んだ生成AIアプリの作り方を紹介します。Gemini2.0のAPIが最近すごく便利になってきていて、Google検索を組み込むようなシステムも簡単に作ることができます。Gemini APIを使って、生成AIのアプリを作ってみたいと思っている方に、参考になれば幸いです。(※今回使ったコードはGithubで公開しています。) 本記事は、「Ubie生成AIアドベントカレンダー」の記事です。 Gemini APIGeminiのAPIを使う方法は、2種類あります。 Google AI StudioのAPI経由 Vertex AIのAPI経由 Google AI StudioのAPIは無料枠もあり、個人のアプリ開発やプロトタイプ作成に適しています。一方で、Vertex AIのAPIは、企業がシス

                                                                          Gemini2.0とStreamlitでお手軽なグラウンディング搭載の生成アプリ作成|masa_kazama
                                                                        • LiteLLM を使って色々な LLM API サービスをいい感じに使いこなす

                                                                          この記事は Magic Moment Advent Calendar 2024 5 日目の記事です。 Magic Moment でプロダクトデータを活用した機能の開発・検討をしている @nagomiso です。 気づけば前回の記事から 1 年が経過していました。時間の流れが早すぎて驚きを隠せません。 ここ 1 年での変化としては体重が大幅に増えました。原因は間違いなくラーメンの食べ過ぎです。節制せねば… 🍜 はじめに Google が Gemini 1.5 Pro / Flush を公開したり OpenAI が GPT-4o / 4o mini, OpenAI o1 / o1 mini を公開したりと 2024 年も LLM の進化には目を見張るものがありました。 こうした進化によって開発で使える高性能な LLM API サービスが増えるのは喜ばしいことですがサービス毎に API が異な

                                                                            LiteLLM を使って色々な LLM API サービスをいい感じに使いこなす
                                                                          • LangGraphのTool Callingを利用して、RAG Agentsを構築する(前編)

                                                                            はじめに Google CloudのVertex AIを活用して、RAGを構築しないといけなくなったので、その方法をまとめていきます。 まずは準備として、ローカルのみで実装をしていきます。 今回の記事では、ローカルに保存したテキストドキュメントをベースに、ローカルのDBにベクトルデータを保存し、LangGraphでRAGを実装していくことを考えます。 その上で、次回以降の記事で、Google CloudのGCSにドキュメントを置いたり、BigQueryをベクトルストアにしたり、Cloud SQLをベクトルストアにしたりする方法を解説していきたいと思います。 参考文献 (書籍のリンクはamazonアフィリエイトリンクです) 記事 LangChainからLangGraphによるAgent構築への移行方法 Chroma DBによる類似度検索のメソッド カスタムRetrieverクラスの作成方法

                                                                              LangGraphのTool Callingを利用して、RAG Agentsを構築する(前編)
                                                                            • 日本語よみがなデータ取得を可能にする Gboard API のご紹介

                                                                              .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                                                日本語よみがなデータ取得を可能にする Gboard API のご紹介
                                                                              • 「エージェントを作るエージェント」を作る

                                                                                概要 対象読者: AIエージェント作ると聞いてビクッとなった人 記事の内容: 「エージェントを作るエージェント(A4A)」というOSSの紹介と、それを使った実装・連携・デプロイの完全ガイド 読んで、得られること: チャットだけでエージェントを作る新しい開発体験と、ADK・A2A・Agent Engineを組み合わせた実践的な技術知見 序説 「いやー、世の中どこでもAIだのAgentだので、またエージェントの記事か。」 そんなことお思いの方、多いかと思います。 そんな私も、読む側だったらそう思って、記事をざーと高速スクロールしたと思います。 (やっぱ、人間スクロールする瞬間が一番ワクワクしてドーパミンでますしね!) はじめに宣言します、 この記事もよくある、頑張ってエージェント作ったよという記事です。 ただ、「作ったものは、エージェントを作るエージェントなんで、みんなも良かったら作ってね」と

                                                                                  「エージェントを作るエージェント」を作る
                                                                                • ゼロからはじめるJavaScript(35) Gemini CLIで日々の作業を自動化してみよう

                                                                                  Googleが2025年6月に公開した「Gemini CLI」が便利だとエンジニアの間で話題になっています。Gemini CLIとは、Googleが開発しているGeminiをターミナルから利用できるAIエージェントです。JavaScriptエンジンのNode.jsをベースとした作りとなっているので、本稿では、環境構築から簡単な使い方までを紹介します。 Gemini CLIのWebサイト Gemini CLIとは? Gemini CLIとは、ターミナル上で動作するオープンソースのAIエージェントです。「Gemini」はGoogleが開発した大規模言語モデル(LLM / Large Language Model)で、「CLI」とはコマンドラインインターフェイス(Command Line Interface)の意味があります。 自然言語を用いて、いろいろな仕事ができるのが特徴です。プログラムの自

                                                                                    ゼロからはじめるJavaScript(35) Gemini CLIで日々の作業を自動化してみよう