タグ

人工知能に関するmisshikiのブックマーク (14,194)

  • Mistral AIがローカル環境で動作する小型で高性能なエージェント型コーディングAI「Devstral」を発表

    フランスのAIスタートアップであるMistral AIと同じくAIスタートアップのAll Hands AIが共同で、ソフトウェア開発向けに構築されたエージェント型のオープン言語モデル「Devstral」をリリースしました。PCでローカル動作するほど軽量で、GPT-4.1-miniやClaude 3.5 Haikuと比肩する性能を持っているとのことです。 Devstral | Mistral AI https://mistral.ai/news/devstral Devstral: A new state-of-the-art open model for coding agents https://www.all-hands.dev/blog/devstral-a-new-state-of-the-art-open-model-for-coding-agents mistralai/Dev

    Mistral AIがローカル環境で動作する小型で高性能なエージェント型コーディングAI「Devstral」を発表
    misshiki
    misshiki 2025/05/23
    “ソフトウェア開発向けに構築されたエージェント型のオープン言語モデル「Devstral」をリリースしました。PCでローカル動作するほど軽量で、GPT-4.1-miniやClaude 3.5 Haikuと比肩する性能を持っている”
  • 手軽に最新LLM!OllamaとQwen3でローカルAI環境を構築する方法 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こんにちわ、kaitoです。最近、AIの世界がまた一段と面白くなってきたよな。特に、ローカル環境でサクッと大規模言語モデル(LLM)を動かせるツールが出てきてから、俺たちの開発スタイルも変わりつつある。 今回は、巷で噂のQwen3っていうLLMを、俺のマシンで動かしてみた話をしようと思う。しかも、手軽に使えるOllamaと、APIテストでお世話になってるApidogを組み合わせてみたんだ。クラウドAPIも便利だけど、やっぱり自分のPCで動かすと、なんかこう、手に馴染む感じがしていいんだよな。プライバシーも守れるし、オフラインでも使えるっ

    手軽に最新LLM!OllamaとQwen3でローカルAI環境を構築する方法 - Qiita
    misshiki
    misshiki 2025/05/23
    “Qwen3をOllamaで動かして、ApidogでAPIを叩いてみるまでの道のりを、初心者プログラマー目線でステップごとに解説”
  • “コーディング最強クラス”の「Claude 4」を使いこなせ 開発元がプロンプトエンジニアリングのコツを紹介

    米Anthropicは5月22日(現地時間)、最新AIモデル「Claude Opus 4」「Claude Sonnet 4」のリリースにあわせ、両モデル向けのプロンプトエンジニアリングのコツを公開した。両モデルは、米OpenAIの「o3」などを超えるコーディング性能を備えるとしており、何点かポイントを押さえることで、より効果的なプロンプトエンジニアリングができるという。 両モデルは、前世代のモデルよりもユーザーの指示に忠実に従うため、具体的に指示を出す必要がある。例えば、ダッシュボードを作成する場合、「分析ダッシュボードを作成してください」と指示するより、「分析ダッシュボードを作成してください。できるだけ多くの関連機能とインタラクションを含めてください。基的な機能にとどまらず、フル機能での実装を構築してください」と指示するほうが効果的という。 他にも原則として、「なぜその動作が重要なのか

    “コーディング最強クラス”の「Claude 4」を使いこなせ 開発元がプロンプトエンジニアリングのコツを紹介
    misshiki
    misshiki 2025/05/23
    “両モデルは、前世代のモデルよりもユーザーの指示に忠実に従うため、具体的に指示を出す必要がある。”
  • Claude 4 プロンプトエンジニアリングのベストプラクティス - Anthropic

    このガイドでは、Claude 4モデル(Opus 4およびSonnet 4)向けの特定のプロンプトエンジニアリング技術を提供し、アプリケーションで最適な結果を得るのに役立ちます。これらのモデルは、以前のClaudeモデルよりも正確な指示に従うように訓練されています。

    Claude 4 プロンプトエンジニアリングのベストプラクティス - Anthropic
    misshiki
    misshiki 2025/05/23
    “Claude 4モデル(Opus 4およびSonnet 4)向けの特定のプロンプトエンジニアリング技術を提供し、アプリケーションで最適な結果を得るのに役立ちます。以前のClaudeモデルよりも正確な指示に従うように訓練されています。”
  • Anthropic の Code with Claude に関する発表まとめ

    tl;dr Anthropic の開発者向けイベント Code with Claude が開催されたよ Claude 4 Opus と Claude 4 Sonnet が発表されたよ 無課金を含むすべてのプランで Claude 4 Opus と Claude 4 Sonnet が使えるよ Anthropic API に Code Execution Tool、MCP Connector、Files API、Extended Prompt Caching の 4 つの機能が追加されたよ(ベータ版) Claude Code が正式リリースされたよ これはなに? 2025 年 5 月 22 日にサンフランシスコにて開催された Anthropic の開発者向けイベント、Code with Claude に関する発表まとめ。公開されたモデルや機能などをひと通り紹介、実際に動かすところまでを解説した記

    Anthropic の Code with Claude に関する発表まとめ
    misshiki
    misshiki 2025/05/23
    “Anthropic の開発者向けイベント、Code with Claude に関する発表まとめ。公開されたモデルや機能などをひと通り紹介、実際に動かすところまでを解説した記事”
  • アンソロピックが「Claude 4」発表、数時間の自律作業可能に

    アンソロピックが新しいAIモデル「Claude Opus 4」と「Claude Sonnet 4」を発表した。数千ステップの複雑なタスクを数時間かけて自律実行できるのが特徴で、24時間以上のゲーム攻略や7時間の自律コーディングが可能。楽天が導入を発表した。 by Rhiannon Williams2025.05.23 6 この記事の3つのポイント アンソロピックが「Claude 4」を発表、数時間の自律作業が可能 24時間ゲーム攻略、7時間自律コーディングを実証、楽天も導入 「アシスタントから真のエージェント」への進化で、人間監督なしの長期作業を実現 summarized by Claude 3 アンソロピック(Anthropic)は、2つの新しい人工知能AI)モデルを発表した。AIエージェントを真に有用なものにするための大きな一歩となる。 発表されたのは、「Claude Opus 4(

    アンソロピックが「Claude 4」発表、数時間の自律作業可能に
    misshiki
    misshiki 2025/05/23
    “両モデルはいずれもハイブリッド構造であり、リクエストの性質に応じて迅速な応答と、より深く推論に基づいた応答のいずれも提供できる。...Web検索や他のツールの活用によって出力の質を高めることが可能”
  • Introducing Claude 4

    Today, we’re introducing the next generation of Claude models: Claude Opus 4 and Claude Sonnet 4, setting new standards for coding, advanced reasoning, and AI agents. Claude Opus 4 is the world’s best coding model, with sustained performance on complex, long-running tasks and agent workflows. Claude Sonnet 4 is a significant upgrade to Claude Sonnet 3.7, delivering superior coding and reasoning wh

    Introducing Claude 4
    misshiki
    misshiki 2025/05/23
    “コーディング、高度な推論、AI エージェントの新しい基準を確立する、次世代の Claude モデル、Claude Opus 4とClaude Sonnet 4 をご紹介”
  • 「Claude Opus 4」「Claude Sonnet 4」発表 ソフトウェア開発などで「o3」超えうたう【更新終了】

    米Anthropicは5月22日(現地時間)に開催した開発者向けイベント「Code with Claude」で、最新AIモデル「Claude Opus 4」「Claude Sonnet 4」を発表した。いずれもソフトウェア開発などの分野で米OpenAIの「o3」を超える性能という。 どちらのモデルも応答速度に長けたモードと、長考によって高いクオリティーの回答を出す「拡張思考」モードを使い分け可能。拡張思考中に同社のWeb検索用APIを使い、回答に反映することもできるという。 Opus 4は同社で「最も強力なモデル」をうたう。コーディングと複雑な問題解決に向くといい、ソフトウェア開発における現実的な課題に対する性能を測るベンチマーク「SWE-bench Verified」では72.5%(計測手法によっては79.4%)の正答率を記録。o3(69.1%)や米Googleの「Gemini 2.5

    「Claude Opus 4」「Claude Sonnet 4」発表 ソフトウェア開発などで「o3」超えうたう【更新終了】
    misshiki
    misshiki 2025/05/23
    “「Claude Opus 4」「Claude Sonnet 4」を発表した。いずれもソフトウェア開発などの分野で米OpenAIの「o3」を超える性能”
  • OpenAIのエージェント構築用API「Responses API」がMCPに対応し他のツールとの連携が容易に&Responses APIで画像生成機能も利用可能に

    OpenAIの「Responses API」は「ウェブ検索」「ファイル検索」「コンピューターの操作」などの機能を備えたAPIで、OpenAIAIモデルを用いたAIエージェントの作成に適しています。そんなResponses APIがツール間のデータ連携方法を定めるプロトコル「Model Context Protocol(MCP)」に対応し、API経由でOpenAI以外のサービスにアクセスできるようになりました。また、Responses API画像生成機能も使えるようになっています。 New tools and features in the Responses API | OpenAI https://openai.com/index/new-tools-and-features-in-the-responses-api/ MCPはツール間でのデータ受け渡し方法を定めるプロトコルで、MC

    OpenAIのエージェント構築用API「Responses API」がMCPに対応し他のツールとの連携が容易に&Responses APIで画像生成機能も利用可能に
    misshiki
    misshiki 2025/05/23
    “Responses APIがツール間のデータ連携方法を定めるプロトコル「Model Context Protocol(MCP)」に対応し、API経由でOpenAI以外のサービスにアクセスできるようになりました。また、Responses APIで画像生成機能も使えるようになっていま
  • Clineで自社製品のMCPサーバーを作って遊んでみた

    こんにちは。 ドリーム・アーツでフロントエンドエンジニアをしている飯野です。 この記事では、自社製品の操作をMCPに対応させる実験をしたときのことを紹介します。 MCPサーバーの実装にはClineを用いることで、私自身が書いたコードは10行程度に抑えることができました。 Clineに興味はあるがあまり使ったことがないという人にも雰囲気が伝わるよう、試行錯誤したポイントなども含めて紹介します。 背景 人気のMCPサーバーを試してみたい、でもあまり時間はかけたくない。 そう考えていたところ、ClineOpenAPIを読み込ませたらほとんど自動でMCPサーバーの開発ができるのではないかと思いつきました。 そこで、自社製品の「SmartDB(スマートデービー)」のOpenAPIを拝借してMCPサーバーを作ってみることにしました。 概要 そもそもClineとは? ClineとはAIエージェント型の

    Clineで自社製品のMCPサーバーを作って遊んでみた
    misshiki
    misshiki 2025/05/23
    “Clineを使うことでMCP Serverのプロトタイプを手軽に作ることが出来た”
  • Windows 11が「MCP」対応って何がすごい? 本格的なAIエージェント時代が見える

    Microsoftは2025年5月19日(現地時間)、年次開発者会議「Build 2025」で「Windows 11」がAIエージェント向けの標準プロトコル「Model Context Protocol」(MCP)に対応すると発表した。 MCPはAIエージェントが外部ツールと連携するための共通プロトコル。さまざまな機能を提供するMCPサーバを構築したり、MCP準拠のアプリケーションを接続したりすれば、AIエージェントが来持たない機能を実現できる。Windows上のアプリは自身の機能をMCPサーバとして提供し、AIエージェントがそれを呼び出すことでより高度な支援や操作が可能となる。まずは一部のパートナー企業向けに数カ月以内にプライベートプレビューを開始する。 MCPの危険性への配慮は? AIエージェントが外部ツールを操作する場合は適切な権限の制御が求められる。MCPの導入に当たってはセキュ

    Windows 11が「MCP」対応って何がすごい? 本格的なAIエージェント時代が見える
    misshiki
    misshiki 2025/05/23
    “Microsoftは今後もMCPを含むエージェント機能の拡張およびセキュリティ強化を継続するとしており、WindowsをAI時代の開発基盤として進化させる方針を明確にしている。”
  • DeepWiki MCPサーバーが出たので試す

    ついさっき OpenAI Responses API がMCPをサポートするようになったという発表があったのですが、そのときにしれっと公開されてました(前からあったならすみません)。 というわけで使ってみます。 設定方法 SSE形式で提供されているようです。 SSEの場合は以下のように指定することで各クライアントアプリから利用できるはずです。 Claude Desktop { "mcpServers": { "deepwiki": { "command": "npx", "args": [ "mcp-remote", "https://mcp.deepwiki.com/sse" ] } } }

    DeepWiki MCPサーバーが出たので試す
    misshiki
    misshiki 2025/05/23
    “GitMCPとDeepWikiを比較してみます。 簡単に試した限りでは、DeepWikiのほうが回答の精度は高いと感じましたが、その分処理速度はやや遅めでした。”
  • 【Github Copilot】設計書があるなら、全部Copilotに実装させよう(途中経過)

    ウォーターフォールモデルに則った大規模開発で設計書があるなら、全部Copilotに実装させよう!をコンセプトに、どうすれば設計書をインプットに、Github Copilotが大規模開発の品質に沿ったコードを生成してくれるか、を日々模索しています。 まだまだ課題はあるものの、少しでも開発の役に立てばと思い途中経過を公開します。 このドキュメントでは、現時点での設計書からCopilotを用いて実装を生成する手順の紹介、使用するツールの紹介、工夫したポイント、現時点での課題について記載します。 こんな人に読んでほしい Github Copilotしか使えない環境にある方 Github Copilotをコードの説明や、単純なメソッド生成をさせる程度にしか使用していない方 期待したコードが生成されず、使わなくなってしまった方 前提 今回生成対象とするのは業務レイヤの実装です。Webアプリケーションで

    【Github Copilot】設計書があるなら、全部Copilotに実装させよう(途中経過)
    misshiki
    misshiki 2025/05/23
    “現時点での設計書からCopilotを用いて実装を生成する手順の紹介、使用するツールの紹介、工夫したポイント、現時点での課題について”
  • VS Code+GitHub CopilotやCursorでBigQueryのAIコーディングをしよう 〜練習問題リポジトリを添えて〜|Mercari Analytics Blog

    VS Code+GitHub CopilotやCursorでBigQueryのAIコーディングをしよう 〜練習問題リポジトリを添えて〜 はじめに:データドリブンな意思決定を、AIで加速する時代へはじめまして、メルカリのProduct Growth Analyticsチームのじゃっこと申します。 主にメルカリShopsや物流関連の分析を担当しつつ、最近はチーム全体の生成AI活用も推進しています。 昨今、GitHub Copilotを始めとするAIコーディング支援ツールや、CursorのようなAIネイティブなエディタの急速な普及は、私たちの分析業務に大きな変革をもたらしつつあります。 しかしその一方で、「その実力はよく耳にするものの、具体的にどう活用すれば良いのか、どこから試せば良いのか分からない」という方も少なくないのではないでしょうか。 このような背景から、最近社内で実施したAIコーディン

    VS Code+GitHub CopilotやCursorでBigQueryのAIコーディングをしよう 〜練習問題リポジトリを添えて〜|Mercari Analytics Blog
    misshiki
    misshiki 2025/05/23
    “BigQueryのオープンデータを活用し、より実践的な形で皆様にも体験していただけるよう、本記事を再構成”
  • 「Cursor」で「難解コード」のリーディングがめちゃ楽になった話 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Cursor擦り倒すシリーズ Cursorで要件定義がエラいスムーズになった話 (続)Cursorで「詳細設計→ガントチャート草稿」作成がめっちゃ楽になった話 「Cursor」×「A5:SQL Mk-2」でテーブル定義書をリッチにする 「Cursor」×「Obsidian」内部リンク生成&最適化プロンプト 「Cursor」で「難解コード」のリーディングがめちゃ楽になった話 ←稿こちら はじめに 「Cursor擦り倒すシリーズ」も、気がつけば第5弾。 要件定義に始まり、詳細設計、テーブル定義書、Obsidian 連携――過去 4 の記

    「Cursor」で「難解コード」のリーディングがめちゃ楽になった話 - Qiita
    misshiki
    misshiki 2025/05/23
    “人間の認知プロセスに沿った段階的なフローを提示し、各ステップでAI(CursorのようなAI支援コーディングツール)をどのように活用すれば理解を深められるか、具体的なプロンプト例と共に解説”
  • Cursorにリーダブルコード準拠のルールを設定しようとして上手くいかなかった話

    はじめに こんにちは、koyablueです。 この前久々にリーダブルコードを読み直しました。 リーダブルコードの内容をルール化してAIに任せるといい感じに適用できるのでは?と思ったのでやってみます。 具体的なコーディング規約準拠かどうか、というルールを適用させている例はわりとある気がしますが、可読性を担保するための汎用的なルールを正しく適用することは可能なのでしょうか(結果はタイトル通りなわけですが)。 やること リーダブルコードからルールにできそうなものを地道に抽出し、マークダウンにする ルールのマークダウンをCursorのProject Rulesに設定する Cursorに「ルールに従ってコードレビューしてください」と投げてレビューさせてみる リーダブルコードから使えそうなルールを抜き出したものがこちらです 抽出したルール # 理解しやすいコードの前提 - 他の人が最短時間で理解できる

    Cursorにリーダブルコード準拠のルールを設定しようとして上手くいかなかった話
    misshiki
    misshiki 2025/05/23
    “結論と所感 ということで、適切にモデルを選択するとうまいことやってくれました。”
  • AIエージェントによる意思決定インテリジェンスの変革

    ガートナーの米国社発のオフィシャルサイト「Insights」などのグローバルコンテンツから、@IT編集部が独自の視点で“読むべき記事”をピックアップして翻訳。グローバルのITトレンドを先取りし「今、何が起きているのか、起きようとしているのか」を展望する。 企業がDX(デジタルトランスフォーメーション)とイノベーションを推進し、自律的なビジネスを目指す中、新しいアナリティクス技術AI人工知能技術の導入が進んでいる。その一つがAIエージェントだ。 AIエージェントは、特定のビジネスコンテキスト(文脈)に合わせて動的な意思決定フローを実現することで、DI(意思決定インテリジェンス)において重要な役割を果たす。データから洞察を導き出し、洞察を行動につなげるまでのタスクをオーケストレーションし、意思決定の拡張と自動化の可能性を押し広げる。 Gartnerは、2027年までにビジネスの意思決定

    AIエージェントによる意思決定インテリジェンスの変革
    misshiki
    misshiki 2025/05/23
    “AIエージェントを意思決定インテリジェンスに統合するため、データとアナリティクスのリーダーが検討すべき4つの項目を紹介する。”
  • ガートナーがAIエージェント、エージェント型AI、チャットbot、RPAの違いを解説

    ガートナージャパンは2025年5月14日、AI人工知能)に関するトレンドになりつつある「AIエージェント」と「エージェント型AI」に関する見解を発表した。ガートナージャパンは「両者の違いについて混乱が見られる」と指摘する。 「AIエージェントは『弱いエージェント型AI』である」 ガートナージャパンの亦賀忠明氏(ディスティングイッシュト バイスプレジデント アナリスト)は、「ガートナージャパンは、『AIエージェントはエージェント型AIの一つ』と捉えている。エージェント型AIは、AIエージェントよりも包括的かつ進化的な概念であり、より高度で自律性の高いAI像を示唆している。見方を変えれば、AIエージェントは『弱いエージェント型AI』と見なせる」と述べている。 同社の見解では、現在の多くのAIエージェントは「手組み細工的な存在」で、ある程度の判断力を持ち、シンプルなタスクの一部を自律的に実行で

    ガートナーがAIエージェント、エージェント型AI、チャットbot、RPAの違いを解説
    misshiki
    misshiki 2025/05/23
    「AIエージェント」と「エージェント型AI」って、見方や切り口が違うだけで、基本的には同じものを指してる気がします。「弱いエージェント型AI」みたいな表現は、ちょっと混乱を招きそうですね。
  • OpenAI、「Stargate UAE」始動 ソフトバンクGも参加

    OpenAIは5月22日(現地時間)、「Stargate UAE」の立ち上げを発表した。ソフトバンクG、米Oracle、米NVIDIA、米Cisco、UAEのAI企業G42などとの協定の下、アラブ首長国連邦(UAE)のアブダビに、大規模な次世代AIインフラクラスターを建設する。 Stargate UAEは、G42が構築し、OpenAIOracleが運用する。NVIDIAは「Grace Blackwell GB300」を提供する。最初のAIクラスタは2026年に稼働開始の予定だ。 参加企業の代表者たち(左から3人目から、NVDIAのジェンスン・ファンCEOOpenAIのサム・アルトマンCEOの、ソフトバンクGの会長兼CEOの孫正義氏、UAEのムハンマド大統領、Ciscoのジーツ・パテル社長 画像:Stargate UAE発表プレスリリースより) このプロジェクトはドナルド・トランプ米大

    OpenAI、「Stargate UAE」始動 ソフトバンクGも参加
    misshiki
    misshiki 2025/05/23
    “OpenAIは5月22日、「Stargate UAE」の立ち上げを発表。ソフトバンクG、米Oracle、米NVIDIA、米Cisco、UAEのAI企業G42などとの協定の下、アラブ首長国連邦(UAE)のアブダビに、大規模な次世代AIインフラクラスターを建設する。”
  • “NPU”も外付けの時代に?450TOPSを誇る推論特化の「Dell Pro Max Plus」

    “NPU”も外付けの時代に?450TOPSを誇る推論特化の「Dell Pro Max Plus」
    misshiki
    misshiki 2025/05/23
    “外付GPUを搭載してAIにも活用するという発想ではなくて、最初からAI推論に特化して外付NPUを採用した製品”