Developerに関するdevgigantlullabyのブックマーク (642)

  • Claude Codeの「すぐルール忘れる問題」を解決する超効果的な方法を見つけた気がする

    どうもこんにちは Claude Codeを使っている人ならみんな感じてると思いますが、CLAUDE.mdでどれだけ緻密なルールを組んでも3ラリーくらいするとすっかり忘れてどんどん適当に動き出すというどうしようもない現象があります そのたびに「ルールを守ってください」と500000000回は打ち込みましたし、指摘し疲れて「/a」で「ルールを再確認してください」というカスタムコマンドまで組んで対処しているような状況でした この問題で難しいのが、「語尾を◯◯にして」だったりそういうしょうもないロールプレイはずっと守るわりに、「事前に確認を取って」とか「このルールで報告して」とかそういう挙動系のルールをすぐ忘れるという点です これをどうにか解決できないかなーと考えていたのですが、そもそもなぜ語尾ルールは守れるのか?という部分から答えを見つけるべきだと思い調査を開始しました なぜ語尾ルールだけは守ら

    Claude Codeの「すぐルール忘れる問題」を解決する超効果的な方法を見つけた気がする
  • Claude Codeに保守しやすいコードを書いてもらうための事前準備やガードレール - くらげになりたい。

    Claude Codeを使いはじめて、いろいろ試してるけど、 なかなかいい感じのコードを書いてくれないな〜と思い、 いろいろ調べてみたときの備忘録(*´ω`*) えいや、でコード生成してくれるけど、 あとで自分で変更したり、保守したりするときに大変なので、 自分がいいとおもう感じに生成してほしかったりする。。 ドキュメントとサンプルコード大事... 事前準備やガードレール一覧 このあたりを用意しておくと、よさそうな感覚 プロジェクトに関するドキュメント(メモリ/コンテキスト: CLAUDE.md) lint/format/自動テストの設定&実行コマンド サンプルコード or テンプレートリポジトリ このあたりは任意、あるとより安心・便利 git-secrets Git Hooks(pre-commits) DevContainer Git Worktree ※おまけ ドキュメント大事・カー

    Claude Codeに保守しやすいコードを書いてもらうための事前準備やガードレール - くらげになりたい。
  • 技術的負債の変質について - じゃあ、おうちで学べる

    はじめに 最近、ふと気づいたことがある。技術負債って、もう昔とは全然違うゲームになってるんじゃないか?いや、もっと正確に言うなら、ゲーム自体が終わろうとしているんじゃないか? コーヒーを飲みながら、10年前に書いた自分のコードを眺めていた。当時は「きれいに書いた」つもりだったけど、いくつかの要望がありよく考えずに変更を加えた結果、負債の塊だ。でも、それを直すのに必要な時間とコストの計算が、根的に変わってしまった。 いや、変わったどころか、もはや「時間とコスト」という概念すら意味をなさなくなりつつある。 syu-m-5151.hatenablog.com 私たちは技術負債を「悪いコード」として理解してきた。しかし、それは大きな誤解だった。Ward Cunninghamが1992年に生み出した原初の概念は、現在広く信じられている「技術的問題」とは根的に異なっていた。 彼の言う負債とは、ソフ

    技術的負債の変質について - じゃあ、おうちで学べる
  • すべてのコーディングエージェントに独立した開発用コンテナ環境を与えられる「Container Use」、Docker創業者がオープンソースで公開

    すべてのコーディングエージェントに独立した開発用コンテナ環境を与えられる「Container Use」、Docker創業者がオープンソースで公開 Docker創業者で現在はプラットフォームエンジニアリングのツールを開発するDagger社の創業者兼CTOのSolomon Hykes(ソロモン・ハイクス)氏は、すべてのコーディングエージェントに対してそれぞれ独立した開発用のコンテナ環境を与えられるオープンソースのツール「Container Use」を公開しました。 container-use has a logo. How do you like it? pic.twitter.com/IcKmbymGLW — Solomon Hykes (@solomonstre) June 7, 2025 AIエージェントがWebブラウザを操作できるようになる「Browser Use」や、AIエージェント

    すべてのコーディングエージェントに独立した開発用コンテナ環境を与えられる「Container Use」、Docker創業者がオープンソースで公開
  • 新しいブラウザ操作系エージェントのworkflow-useがかなり良さそうな予感

    Browser Useから新しいブラウザ操作系エージェントが登場しました めちゃくちゃ魅力的だったので紹介します。 従来のブラウザ操作系エージェント browser-useに限らず、従来のブラウザ操作系エージェントはユーザーからの自然言語な指令をもとにブラウザを操作します。 AIエージェントは画面キャプチャ + DOMの取得 → キャプチャを解析 → クリックすべき要素を推論 → playwrightで操作をループしてタスクを行います。 現在僕もよく使っているのですが、何点か課題があります。 どうしてもアクションに揺らぎがある 自然言語での指示である以上仕方ないのですが、「〇〇をクリックして〇〇をしてほしい」と言った細かい指示はプロンプトのチューニングが不可欠であり使用モデルの賢さにも依存します。 処理に時間がかかる 画面キャプチャ + DOMの取得 → キャプチャを解析 → クリックすべ

    新しいブラウザ操作系エージェントのworkflow-useがかなり良さそうな予感
  • Claude Code Actionのプロンプト設計が、AIエージェント開発にかなり参考になる件

    Devin, Coding Agent (Github Copilot), Codex (OpenAI) やJules (Google)のような、バックグランド動作するコーディングエージェントが続々と発表されて、ついに先日のAnthropicのカンファレンスでClaude Codeでも同様のことが行えるようになりました! Claude CodeのDevin型コーディングエージェントはGithubワークフロー上で動作するのですが、なんと実装のコードがなんと公開されているではありませんか!! プロンプトやGithubのMCP設定等の実装も垣間見ることが出来ます! AIエージェントを開発している身からすると常時稼働型エージェントを作りたいと考えており、バックグラウンド型のコーディングエージェントの動作はどうしても深ぼらねばと思っていた矢先に撒き餌が...! それだけでなく、プロンプト設計自体の完

    Claude Code Actionのプロンプト設計が、AIエージェント開発にかなり参考になる件
  • 子育てエンジニアに捧ぐ子どもを喜ばせるためのTips集

    はじめに 日々育児、家事と仕事を両立し最新の技術動向もキャッチアップしているパパママエンジニアの皆さまお疲れ様です。 そんな心身ともにぼろぼろな子育てエンジニアのみなさんはPCに向かって作業をしている時間が至福の時となっていることでしょう。 しかし、そんなひと時を邪魔する小さな訪問者が存在するのです。 記事ではそんなかわいい訪問者を喜ばせてあげるためのTipsをいくつかご紹介します。 対象読者 1 ~ 3歳くらいのお子さんを持つエンジニアの方 在宅で仕事をすることが多い方 最近、仕事部屋に子どもが入ってきて困っている方 とはいえ、かわいい子どもを喜ばせてあげたい方 slコマンド slコマンドはlsコマンドのタイポを矯正するための素晴らしいコマンドです。 MacであればHomebrewでインストールできるので、まだインストールしていない方はインストールしましょう。 実行すると以下のようにS

    子育てエンジニアに捧ぐ子どもを喜ばせるためのTips集
  • 【ついにきたか】OpenAI Codex - OpenAIが生み出した天才コーディングエージェント

    概要 OpenAIは2025年5月16日、新たなAI搭載のコーディング支援エージェント 「Codex」 を発表しました。これは従来のコード補完モデル(旧Codex API)とは異なり、 クラウド上で動作する自律型のソフトウェア開発エージェント です。Codexは並列に複数のタスクをこなすことができ、コードの新機能実装、コードベースに関する質問への回答、バグ修正、プルリクエストの提案など、様々な作業を代理で実行してくれます。各タスクはクラウド上の独立したサンドボックス環境で実行され、ユーザーのリポジトリがあらかじめ読み込まれた状態で処理が行われます。 Codexの頭脳となっているのは 「codex-1」 と呼ばれる最新モデルで、OpenAIの高度な大規模言語モデル「o3」系列をソフトウェア開発向けに最適化したものです。このモデルは実際のコーディングタスクを用いた強化学習(実環境で試行錯誤させ

    【ついにきたか】OpenAI Codex - OpenAIが生み出した天才コーディングエージェント
  • DeepResearchで気になったことを調べ、出てきた資料を、全てNotebookLMへ移行する「第二の脳とAIを融合したワークフローの流れ」が参考になる

    Hiroya Iizuka @0317_hiroya 最近やっている、第二の脳とAIを融合したワークフローの流れ - DeepResearch(Gemini, Genspark, ChatGPT)で、気になることを調べる - 出てきた資料を、全てNotebookLMへ移行 - よくある質問、ブリーフィングメモなどを作成 - Chat欄で壁打ち - Obsidianに、リンクを保存。 - 壁打ち内容で、Cornel Noteを作成 - 裏側に図解かく - Permanent Noteを切り分ける 順に説明します。 2025-02-17 09:10:24 Hiroya Iizuka @0317_hiroya Deep Research => 資料作成 Geminiは、Google Docが作成されるから、これをそのままNotebookLMが、読み込むことができる。 Gensparkは、Spar

    DeepResearchで気になったことを調べ、出てきた資料を、全てNotebookLMへ移行する「第二の脳とAIを融合したワークフローの流れ」が参考になる
  • ソフトウェアエンジニアが抱えやすい21の苦労 - mtx2s’s blog

    ソフトウェア開発の現場でも、日々、苦労が絶えない。知らず知らずのうちに、エンジニアを消耗させる問題が潜んでいる。 苦労は、日常の風景に溶け込みやすい。それが当たり前の状態であり、疑問すら抱かれない。「そういうものだ」と思い込む。いや、苦労することに、そもそも違和感を持てないのだ。 日常化した苦労は、改善されることがない。違和感がないからこそ、問題として扱われない。そして、原因に目が向けられることもなく、風景に溶け込んだまま、空気のようにあり続ける。 つまり、苦労を軽減するには、日常風景の中から問題を見つけ出す必要がある。そのための第一歩が、「気づく」ことだ。問題というのは、気づかなければ解決のしようがない。学校の試験のように、誰かに出題されるものではないのだから。 記事では、「気づく」ための視点を言語化し、手がかりとして整理している。 ソフトウェアエンジニアリング業務でありがちな苦労を、

    ソフトウェアエンジニアが抱えやすい21の苦労 - mtx2s’s blog
  • “イリヤ神”がまたやった 動画生成AI「FramePack」が革命的なワケ (1/4)

    動画作例で使用した連載の作例キャラの「明日来子(あすきこ)」さん。Midjounery v7の新機能「Omni-Refernece」で作成 4月17日に登場した動画生成AIプログラム「FramePack(フレームパック)」が世界的に衝撃を与えています。PCローカル環境で動画AIを動かすには、少なくともビデオメモリー(VRAM)が12GBあるビデオカードを搭載していないと難しいというのが常識でした。ところが、VRAM 6GBでも安定的に動作させられるため、一気に動画AIの裾野を広げそうです。開発したのは、画像生成AI分野で「ControlNet」や、使いやすいツール「Fooocus」などを開発してきたことで知られる、スタンフォード大学に在籍中のIllyasviel(イリヤスフィール、以下イリヤ)さん。既存の方法論にまったく違ったアプローチでブレイクスルーを引き起こす、“イリヤ神”のアプロー

    “イリヤ神”がまたやった 動画生成AI「FramePack」が革命的なワケ (1/4)
  • 話題のDeepWikiをセルフホスト?DeepWiki-Openを試してみた

    最近、「DeepWiki」が注目されているという話をよく聞きます。 DeepWikiはGithubリポジトリのコードを解析し、自動的にWikiを作成してくれるサービスなのですが、無料プランではプライベートリポジトリに対応していないなど、利用できる機能に制限があります。 そこで、DeepWikiの機能をOSSで実現し、さらに機能が追加されたものがないか探してみたところ、ぴったりのプロジェクトが見つかりました。 OSSで実現したものががありました。その名も 「DeepWiki-Open」 です。 そこで今回は、セルフホスト環境でDeepWiki-Openを使用してみました。 概要 DeepWiki-Openは以下の技術を使用しているようです。(家DeepWiki 調査) フロントエンド React Next.js ReactMarkdown Mermaid.js Tailwind CSS

    話題のDeepWikiをセルフホスト?DeepWiki-Openを試してみた
  • プロダクトマネージャーがCursorと作る、"思考が蓄積する"仕事環境 ~AI伴走を当たり前に~|Naomi Shiraishi

    プロダクトマネージャー業務は、日々のタスクから中長期の戦略策定まで、多岐にわたります。忙しさに追われ、その日の思考や課題が記憶の彼方に消えてしまう… 私はそのスパイラルに入ってしまっており、タスク管理ツールやtimesに「日報」を書いたりと試行錯誤していたものの、何度も挫折していました。 Cursorとの出会いと活用のひらめきそんな中、社内で利用が広まっていたAIエディタ「Cursor」。 当初は、ノンエンジニアでもコード調査やSQL作成が出来ることや、一貫したドキュメント作成が出来ることに魅力を感じて使っていました。 これまで私のAI活用は、「PRDの壁打ち」に代表されるドキュメント作成の補助、「開発仕様の確認」など特定の複雑な業務だけにとどまっていました。 小さな日常的タスクにもAIを絡められる可能性があるとは、正直あまり想像できていなかったのです。 きっかけは、みやっちさんのCurs

    プロダクトマネージャーがCursorと作る、"思考が蓄積する"仕事環境 ~AI伴走を当たり前に~|Naomi Shiraishi
  • After Cline - あるいは語りえぬ者について語ろうとする時代について

    post-cline-world.md After Cline - あるいは語りえぬ者について語ろうとする時代について この資料は以下のイベントの登壇用の殴り書きです https://hack-at-delta.connpass.com/event/350588/ 今までの資料を引用して話すので、この資料はアウトラインです。 最初に: 自分の技術選定の基準 ハイプサイクルにおけるアーリーアダプター相当で手を動かす ハイプ・サイクル https://mba.globis.ac.jp/about_mba/glossary/detail-20659.html https://www.thoughtworks.com/radar を読む イノベーターっぽい人達をSNSで監視してる 一定の熱量を感じたら自分でも動かして評価する 破壊的イノベーションを逃すな 破壊的イノベーション - クリスチャン・ク

    After Cline - あるいは語りえぬ者について語ろうとする時代について
  • リモートMCPがやってくる、そしてA2Aについて

    先日 Streamable HTTP Transportに対応したMCP TypeScript SDK 1.10.0がリリースされました。これは、以前のSSE Transport(2024-11-05)を置き換えるものです。Python SDK(最新バージョン1.6.0)にはまだこの更新が含まれていないようです。 Release 1.10.0 · modelcontextprotocol/typescript-sdkStreamable HTTP release This is the first release supporting the new Streamable HTTP transport from protocol version 2025-03-26, which supersedes the SSE transport from protocol version 2024

    リモートMCPがやってくる、そしてA2Aについて
  • リモートMCPサーバーカタログ - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 前書き 技術の進歩は急速であり、ここでお話しする内容はあくまで現時点(2025年4月18日)のものです。 MCPとは何か Model Context Protocol(MCP)は、大規模言語モデル(LLM)をさまざまなデータソースやツールに接続するための標準化されたプロトコルです。 LLMに対して独自のツールや機能を提供し、AIアシスタントの能力を大幅に拡張することができます。 詳しい説明は稔さんのスライドをご参照してください、マジでわかりやすいです なぜリモートMCPサーバー 現在、多くのMCPサーバーはユーザーがローカル環境にインス

  • OpenAI - エージェント構築のための実践ガイド 日本語翻訳

    OpenAIからエージェント構築のための実践ガイドが公開されました。非常に勉強になったので、全文を日語に翻訳しながら読みました。翻訳の正確さは保証できませんが、メモとして書き残します。 はじめに 大規模言語モデルは、複雑なマルチステップのタスクを処理する能力がますます高まっています。推論、マルチモダリティ、ツール利用の進歩により、エージェントとして知られるLLM(大規模言語モデル)を活用したシステムの新しいカテゴリが生まれました。 このガイドは、初めてエージェントを構築しようとしている製品チームやエンジニアリングチーム向けに設計されており、多くの顧客導入事例から得られた洞察を、実践的で実行可能なベストプラクティスにまとめています。有望なユースケースを特定するためのフレームワーク、エージェントのロジックとオーケストレーションを設計するための明確なパターン、エージェントが安全かつ予測可能で効

    OpenAI - エージェント構築のための実践ガイド 日本語翻訳
  • ついに1000万トークンを把握!人間の一生分の情報を理解してくれるオープンウェイトLLM Llama4登場|shi3z

    ついに1000万トークンを把握!人間の一生分の情報を理解してくれるオープンウェイトLLM Llama4登場 朝起きたら突然、Llama4が超絶進化して登場していた。 中でも、シングルGPUで動作するLlama4 Scoutは1000万トークンのコンテキストウィンドウを装備。しかもシングルGPUで動作可能。アクティブパラメータはわずか17B(トータル109B) 1000万トークンって、単行100冊分だぞ。 単行100冊の知識が常に頭にある知性ってやばくないか。 ワイだって相当を読んできた方だが100冊分の知識を澱みなく把握するのは不可能。 さらにLlama4 Maverickは、挨拶がわりに100万コンテキストでしかもシングルGPU(多分VRAM 80GBくらいの)で動作可能。こちらもアクティブパラメータ数は17Bでトータル400B。量子化やメモリオフロードがしやすい構成だ。 Scou

    ついに1000万トークンを把握!人間の一生分の情報を理解してくれるオープンウェイトLLM Llama4登場|shi3z
  • 👨‍🔧 人間をMCPツールとして利用する

    何の説明もしないで、突然このチャットを始めて人間をMCPツールとして利用している様子を見せたので、不気味がってもらえた。 MCPサーバーは単純に human_* という名前のツールを提供して、そのツールに依頼されたことをローカルのSQLiteに “タスク” として書き込む。同じSQLiteを参照するWebアプリケーションには書き込まれた “タスク” が並んでおり、そのタスクに対して実際の人間が応答するとMCPサーバーは回答を待ち受けており、最終的にMCPクライアントに実際の人間の応答が返されるという仕組み。

    👨‍🔧 人間をMCPツールとして利用する
  • AIを用いた開発の効率を最大化させるためにやっていることを全部書く

    こんにちは、しば田です。 AI を用いたプログラミング、中々難しいです。 日々どうしたら効率を最大化できるかを日々試行錯誤していますが、なかなか正解に辿り着けている気もしないしモデルの登場のたびにチューニングが必要なのでツラいですね。 この記事では、自分の思考整理も兼ねて常日頃から私が意識して行っている Tips に関してまとめてみました。重要なことから些末なことまで全て書いています。 最近、Cursorのコミュニティが出していたTips17選に対して自分の考えを書いたのですが、 反響があったのでもっと網羅的に書きたいなと思い記事を書くことにしました。(30個くらいあります。) ※記事の対象者は Cursor、Windsurf、Cline(Roo)あたりを使ってプログラミングしている人を想定しています。 ※一覧性を優先するのでそれぞれを深くは語りません。 ※多分抜け漏れがあるので適宜追加し

    AIを用いた開発の効率を最大化させるためにやっていることを全部書く