タグ

関連タグで絞り込む (484)

タグの絞り込みを解除

aiに関するdeejayrokaのブックマーク (1,061)

  • SO-ARMとACTで実践する模倣学習

    はじめに 記事では、オープンソースのロボットアーム SO-ARM と模倣学習アルゴリズム ACT を用いて、模倣学習を実施する一連のプロセスを紹介します。 環境構築、データ収集、モデル学習、そして実機評価まで、筆者が実際に試したコマンド、直面した課題について詳しく解説します。可能な限り、つまずきやすいポイントや気になった部分を細かく記載しているので、これから始める方の参考になれば幸いです。 SO-ARMとは SO-ARM(Standard Open Arm) は、RobotStudio と HuggingFace が共同で開発したオープンソースのロボットアームです。3Dモデル、ソフトウェア、部品リストなど、ロボットを作るために必要な情報がすべて無償で公開されており、誰でも市販のパーツを揃え、3Dプリンターでパーツを出力することで、格的なロボットアームを自作できます。 以下のGitHub

    SO-ARMとACTで実践する模倣学習
  • なぜもっと早く使わなかったのか...データベース系MCPでデータ分析が楽しい! - Qiita

    はじめに こんにちは。MCPを使ったデータ分析をやって感動したのでシェアします。 私は、社内チームで使えるLLMサービス(以下、部内ツール)をチームメンバー限定で運用しています。 日毎の利用状況はどうか?どのLLMが使われていなくて置き換えた方がいいのか?よく使うユーザーは誰か?など、知りたいとは思っていても、なかなかSQLを叩いて分析するのは面倒だなと感じていました。 (部内ツールのDBSQLiteなので)SQLite MCPを導入してからというもの、日語で分析して欲しいことを指示するだけで、これらのデータ分析がものの2分でできるようになりました!とにかくデータ分析をするのが楽で、楽しくなりました。 記事では、MCPの導入、実際の分析のやり方を説明します。 筆者の環境 M4 Macbook Pro: Sequoia 15.6.1 Claude Code: 1.0.100 sqlit

    deejayroka
    deejayroka 2025/09/29
    “できる”
  • 「Vibe Coding」から「Spec-Driven Development」仕様駆動開発(SDD)入門

    「Vibe」から「Spec-Driven」な開発へ。AI時代の仕様駆動開発(SDD)入門 近年、AIを活用した「バイブコーディング」が、アイデアを迅速に形にする手法として注目を集めています。これは「感覚」や「雰囲気」を重視した、直感的で探索的なコーディング手法です。しかし、そのスピード感とは裏腹に、プロジェクトの持続可能性という点で大きな課題を抱えています。 記事では、その場限りの「Vibe(感覚的)」な開発から、真に「Spec-Driven(実行可能で持続可能)」な開発へと進化するための考え方と、その中核をなす**Spec-Driven Development(仕様駆動開発)**について、具体的なツール例も交えながら解説します。 はじめに この記事の対象読者 AIの力を借りて高速にプロトタイプを作ったが、その後のチーム開発や機能追加で「これ、どうなってるんだっけ…?」と困った経験のある

    「Vibe Coding」から「Spec-Driven Development」仕様駆動開発(SDD)入門
  • マルチエージェントシステムのアーキテクチャーを紐解く

    はじめに 2025年8月5日〜6日に開催された Google Cloud Next Tokyo のブレークアウトセッションで、図のようなマルチエージェントシステムのデモを紹介しました。これに対して、予想外に反響が大きく、詳しいアーキテクチャーを知りたいという問い合わせを多数の方からいただきました。そこでこの記事では、このデモシステムのアーキテクチャー設計を例にして、ADK による実装例とあわせてマルチエージェント設計の基を紹介します。 マルチエージェントシステムのデモ構成 デモの内容 このデモでは、「ネット記事の作成業務」を例としています。Gemini に「記事を書いて!」とお願いするだけでもそれらしい記事は生成できますが、ここでは、より実業務に即した業務フローをマルチエージェントで実現しています。具体的には、次のような流れになります。 (1) ユーザーが記事のテーマを入力する ↓ (2

    マルチエージェントシステムのアーキテクチャーを紐解く
  • LLM時代の仕事 - Software Transactional Memo

    Geminiに書いてもらったPDCAモーターサイクル いちプログラマである僕の視点では、現在の世界はAIに熱狂している。 特にLLMを使ってコードを書かせるばかりか、その先のデバッグまでLLMに任せる時代はもう少し先だと思っていたら早くも登場して世間を沸かせている。 ソードアートオンラインのように「システムコール」と前置すればただの単語予測器にできる範疇以外の事にも手を伸ばせる事はわかっていたが、LLMがこんなに早くその「システムコール」を操ってものを動かせるという直感を持ち合わせていなかったのを恥じるばかりである。少しシリアスにLLMの出力をチューニングしようとした人ならわかると思うが、LLMが真にすごいのは知識を貯めておける事というよりパターンに従うのがとんでもなく上手いと言う事である。 プロンプトチューニングで「あなたは○○の専門家です」などと入れるロールプレイングは出力の品質を大き

    LLM時代の仕事 - Software Transactional Memo
  • n8nで作って学ぶAIエージェント【2025最新版】

    AIエージェントの主な特徴 AIエージェントがユーザーに代わって信頼性高く、一貫して動作するために、以下の重要な特性を備えています。 LLMによるワークフロー管理と意思決定: 大規模言語モデル(LLM)を活用してワークフローの実行を管理し、意思決定を行います。ワークフローの完了を認識し、必要に応じて自律的に行動を修正できます。また、失敗した場合には実行を停止し、制御をユーザーに戻すことができます。 多様なツールへのアクセスと動的な選択: 外部システムと連携するための様々なツールにアクセスできます。これにより、状況を把握したり、アクションを起こしたりすることが可能です。ワークフローの現在の状態に応じて適切なツールを動的に選択し、明確に定義されたガードレール(制約)の範囲内で常に動作します。 記憶と文脈認識: タスク全体を通して文脈を維持し、以前のやり取りや指示を記憶します。この永続的な記憶に

    n8nで作って学ぶAIエージェント【2025最新版】
  • AI Agentが回答に困った時にSlackで人間に助言を求められるMCPを検証した | 株式会社AI Shift

    こんにちは AIチームの戸田です 今回は、AI Agentが自身で解決できない問題に直面した際に、Slackを通じて人間に助言を求めることができるMCP(Model Context Protocol)、AskOnSlackMCPをつくったので、架空のカスタマーサポートのデモを交えて紹介したいと思います。 https://github.com/trtd56/AskOnSlackMCP Human-in-the-loop 近年、AI Agentの能力が向上し、コーディングや業務効率化など多くの領域で活躍が増えていますが、まだ人間の判断や専門知識が必要な場面は多く存在します。例えばカスタマーサポートのような、複雑な問題解決や感情的な配慮が必要な領域では、AIと人間の協働(Human-in-the-loop)が重要になります。 実現するためのツール これをAI Agentで実現する方法として、一つ

    AI Agentが回答に困った時にSlackで人間に助言を求められるMCPを検証した | 株式会社AI Shift
  • バイブコーディングを加速させる Vibe Logger入門チュートリアル|深津 貴之 (fladdict)

    「ClaudeCodeフレンドリーなログを作るシステムがあれば、バイブコーディングの効率があがるのでは?」という仮説から、GenAI時代のロガーを作ってみた。お暇な方は、仮説検証にお付き合いください。 AI時代のログ作成術:あなたのAI助手がコードを理解できるログを作ろう 従来のログは人間向けでしたが、今やClaude CodeやGemini CLIなどのAI助手がコードを理解し、デバッグを手伝ってくれる時代です。 VibeLoggerは、コーディングエージェントが活用しやすい「構造化されたログ」を簡単に作成できるPythonライブラリです。 🎯 なぜVibeCoding Loggerが必要なのか?従来のログ(人間向け)import logging logging.info("User profile fetch failed for user 123")→ AIには「何が起きたか」しか

    バイブコーディングを加速させる Vibe Logger入門チュートリアル|深津 貴之 (fladdict)
  • Obsidian x Gemini CLIで最強執筆環境を作ろう|Naoki |電電猫猫

    目標:CursorみたいにObsidianを改造ObsidianMarkdownのViewerとして最強だ!でもAIとのコラボレーションはまだまだ弱い.ツールチェインとかがないからAIに記事を修正させるとかはまだまだ難しい….というのは以前の話で今回はObsidian Terminal & Gemini CLIで最強執筆環境を設定していこう. 最終的な地点便利な点はここらへんかな ファイル整理を自動でさせられる タイトル設定をファイルの中身を読んで自動で変更するとかできる 執筆でAIによる編集などをさせられる DeepSearch的に調べた内容をまとめさせる Gemini CLIを有能な司書としてObsidianのメモのメンテナーとしつつ,雑に探し物を調べさせる秘書としても扱うことができるのである. 環境を作っていくterminalをいじる必要がでてくるのでちょっとめんどい.まあできるだ

    Obsidian x Gemini CLIで最強執筆環境を作ろう|Naoki |電電猫猫
  • 仮面ライダー新作「ゼッツ」発表、「生成AIか否か」に注目集まる デザインやティーザー映像の背景が話題

    仮面ライダー新作「ゼッツ」発表、「生成AIか否か」に注目集まる デザインやティーザー映像の背景が話題(1/2 ページ) 東映は7月6日、テレビシリーズ「仮面ライダー」の新作「仮面ライダーゼッツ」を発表した。同日にはティーザー映像も公開。SNSでは映像の背景や仮面ライダーそのもののデザインに漂う“生成AIっぽさ”が話題になっており、11日に予定されている続報に注目が集まっている。 ティーザー映像は、新しい仮面ライダー「ゼッツ」や、その変身ベルトの見た目などを披露するもの。仮面ライダーシリーズ公式Webサイトでは番組の設定も一部公開し、ゼッツが「人の夢に潜入し、ミッションを遂行するエージェントである」ことを明らかにした。

    仮面ライダー新作「ゼッツ」発表、「生成AIか否か」に注目集まる デザインやティーザー映像の背景が話題
  • ObsidianにGemini CLIを導入したら、数分で6335文字書いてくれた - izanami

    Obsidian に、最高最新のLLMを適用したいと思ってた 以下の手順で、ObsidianでGemini CLIが使えた Obsidian Terminal インストール .zshrc に node パス設定 再起動 → darwinintegratedDefault パスを設定する 参考 その後、ObsidianにGemini CLIを導入して、数分で6335文字書いてくれた内容はこちら。雑な指示でこれなんで、しっかり指示すればもっとよい記事を生成してくれる。しかも無料。使わない手はない ↓ はじめに:なぜObsidianに「外部のAI」を接続するのか? Obsidianは、私たちの思考を記録し、繋げ、育てるための強力な「第二の脳」です。その哲学の根幹には、ローカルファースト、マークダウンによる普遍性、そしてユーザーによる完全なコントロールがあります。 だからこそ、多くのパワーユーザー

    ObsidianにGemini CLIを導入したら、数分で6335文字書いてくれた - izanami
  • コーディングエージェントごとに独立したコンテナを提供するcontainer-useを動かしてLLMを並列同時実行してみた

    3秒まとめ container-useで Docker コンテナ内にコーディングエージェントの実行環境を独立して作成可能 複数のエージェントを並列実行してローカルで安全に開発環境を管理できる MCP経由で Claude Code、Cursor、goose などから簡単に操作可能 Git worktreeよりもクリーンで管理しやすい環境分離を実現 どんな人向けの記事? ローカルで複数のコーディングエージェントを並列実行したい方 Dockerコンテナ内で安全にAI開発環境を管理したい方 Claude Code、Cursor、gooseなどのMCP対応クライアントを使っている方 Git worktreeの代替手法を探している方 概要 Docker の創業者の 1 人が、特定のワークツリーをコンテナ内に配置してコーディングエージェントを動作させるツール「container-use」を開発しました。

    コーディングエージェントごとに独立したコンテナを提供するcontainer-useを動かしてLLMを並列同時実行してみた
  • Claude CodeとContext Engineering。カスタムコマンドを追加してコンテキスト付与を自動化

    @dyoshikawaです。 Claude Codeにカスタムスラッシュコマンドを追加してみたら良い感じだったので紹介します。 コンテキストエンジニアリングの重要性 AIコーディングに取り組んでいると、いかにしてAIに的確なコンテキストを与えられるか、そしてそれを自動化できるかのゲームであると感じています。最近は「コンテキストエンジニアリング」という言葉も登場しているようです。 2025年において、世の中のモデルは極めて高い知能を持っています。しかし、最も賢い人間であっても、何を求められているかという文脈なしには効果的に仕事をすることはできません。「プロンプトエンジニアリング」は、LLMチャットボットにとって理想的な形式でタスクを記述するための取り組みを表す用語として生まれました。「コンテキストエンジニアリング」は、これの次のレベルです。動的なシステムにおいて、これを自動的に行うことです。

    Claude CodeとContext Engineering。カスタムコマンドを追加してコンテキスト付与を自動化
  • 最先端のオープンソースTTSモデル『Chatterbox』とは!?〜使い方から技術詳細まで〜

    はじめに こんにちは、Parakeet株式会社リサーチャーの今井(X: Nuts)です。 2025年5月29日に、Resemble AIからオープンソースText-to-Speech(TTS)モデル、Chatterboxが公開されました。 state-of-the-art TTS model that just beat ElevenLabs in blind evaluations ブラインド評価でElevenLabsに勝利したSoTA TTSモデル 記事でわかること 記事では、以下の流れでChatterboxについて掘り下げていきたいと思います。 Chatterboxの何がスゴいのか ― READMEから差別化ポイントを読み解く インストールから推論まで ― 最速5分で動かす手順 技術詳細を深掘り ― ベース技術と独自の改良点を解説 実際の音をチェック ― 生成サンプルをレビュー

    最先端のオープンソースTTSモデル『Chatterbox』とは!?〜使い方から技術詳細まで〜
  • AI時代の安全基準、「OWASP AI Testing Guide」が始動 その中身とは?

    セキュリティ関連のオープンコミュニティーであるOWASP(Open Worldwide Application Security Project)は、2025年4~6月にかけて「OWASP AI Testing Guide」の初期草案を作成し、続く6月に同プロジェクトの全体像や目的、試験分類を明確に定義した初期ドラフトを公開した。 コミュニティーの形成が進められており、OWASP公式の「GitHub」リポジトリーの設置と専門チームが立ち上がった。この取り組みはAIの広範な普及に伴って求められるセキュリティや倫理、信頼性、法令順守の観点からの包括的な検証手法の確立を目指している。 「OWASP AI Testing Guide」が開くAIの安全な未来 AIが社会や産業の中核を担う中、従来のアプリケーションセキュリティガイドでは対応しきれない新たなリスクが生じている。これまではOWASPが提供

    AI時代の安全基準、「OWASP AI Testing Guide」が始動 その中身とは?
  • Claude Codeで実用的なWebサービスを作る|himara2

    こんにちは!ひまらつ(@himara2)です。 Claude Codeが話題ですね。実際に使ってみるとClineやCursorなどのAIエージェントと比べて賢さのレベルが高く、開発アシスタントとして次のレベルに来ているような気がします。 サンプルアプリやプロトタイプを作れるのは確実なので、今回はデータベースを持つ実用的なアプリケーションをどれくらい作れるか試してみました。これからClaude Codeを触る方のヒントとなれば幸いです:) 今回作ったもの麻雀点棒管理アプリを作った麻雀をするときに点数の管理をするWebアプリです。 定期的に友人麻雀をしてるんですが、友人宅にある自動雀卓機が点数表示に対応していないモデルで毎回ちょっとだけ困っていたのでその解決が目的です。 課題としては超ニッチです。このWebアプリが爆発的にヒットする可能性はまずありませんが、AI開発はコストが低いので自分専用

    Claude Codeで実用的なWebサービスを作る|himara2
  • Best Practices for Machine Learning Systems: An Industrial Framework for Analysis and Optimization

  • Zalando Engineering Blog - A Systematic Approach to Reducing Technical Debt

  • ABEJA Qwen2.5-32B Modelの事後学習に向けたデータセット作りの道のり - ABEJA Tech Blog

    ABEJAでデータサイエンティストをしている大谷です。 弊社は、経済産業省とNEDOが実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の1期に続き、2期にも採択され、そこで大規模言語モデルの開発を実施しました。 これまでにGENIAC2期の取り組みで3つのモデルを公開してきました。 これらのモデルはAlibaba社が開発したQwen2.5-32B-Instruct、QwQ-32B、Qwen2.5-7B-Instructをベースモデル、差分Vector用モデルとして用いています。 7Bと32Bのv0.1のモデルは事後学習を実施する前のものです。 これらに事後学習を行い更に精度をあげるべく 、SFT用データセットとDPO用のデータセットを2万件弱ずつ合成データ+人手によるアノテーションで作成し

    ABEJA Qwen2.5-32B Modelの事後学習に向けたデータセット作りの道のり - ABEJA Tech Blog
  • Googleプロンプトエンジニアリングホワイトペーパー完全解説:実践テクニックとベストプラクティス - ABEJA Tech Blog

    はじめに こんにちは!ABEJAのシステム開発部でソフトウェアエンジニアをしている関です。 日々の業務でLLMを活用する中で、「AIにどう指示すれば効率的に期待どおりの結果が得られるのか」という課題に直面していました。試行錯誤の繰り返しで時間を取られることも多く、このやりとりを効率化したいと考えていた時に出会ったのが、Googleが2025年2月に公開したプロンプトエンジニアリングに関するホワイトペーパーです。その内容は非常に実践的で、私のLLM活用スキル向上に大いに役立つものでした。 このホワイトペーパーは、プロンプトエンジニアリングの基礎から応用まで、実践的な手法を網羅的に解説しています。ホワイトペーパーが述べるように、「データサイエンティストや機械学習エンジニアである必要はありません—誰でもプロンプトは書けます」。しかし、より正確で有用な出力を安定して得るためには、やはり知識と体系的

    Googleプロンプトエンジニアリングホワイトペーパー完全解説:実践テクニックとベストプラクティス - ABEJA Tech Blog