Uncap your potential and get all of your development done using Gemini Code Assist for individuals at no cost, or Gemini Code Assist for your business. Gemini Code Assist brings the power of Gemini 2.5 to your IDE at no cost, with a chat interface that is aware of your code, automatic code completions as you write, and generation and transformation of full functions or files on demand. A limit of
You Should Write An Agent Author Name Thomas Ptacek @tqbf @tqbf Image by Annie Ruygt Some concepts are easy to grasp in the abstract. Boiling water: apply heat and wait. Others you really need to try. You only think you understand how a bicycle works, until you learn to ride one. There are big ideas in computing that are easy to get your head around. The AWS S3 API. It’s the most important storage
この記事は、すでにCodexやClaudeCodeなどのAIコーディングツールを実際に使い始めているエンジニアに向けて書いている。「期待ほど効率が上がらない」と感じている人や、運用の型を模索している個人開発者を想定している。導入方法や基礎理論は扱わない。ひとりのエンジニアが数ヶ月間Codexと向き合って得た、実践的な運用知見を語る。 数ヶ月で変わったこと まず、ここ数ヶ月でAIコーディングツールの使い方が大きく変わったという話からしたい。 数ヶ月前のClaudeCodeガードレール戦略全盛期と比べると、隔世の感がある。あの頃は、AIが暴走しないように制御する、余計なことをさせないようにガードレールを張り巡らせることに頭を悩ませていた。Kiroが登場したときも、その延長線上にあった。 しかしGPT-5-Codexの登場で、その流れが変わった。 コンテキスト詰め込み時代の終わり 何が変わったの
AIが読むんだから読みやすくする必要はないんでは、という話が流れてきた。 けど、実際にはAIにも読みやすさは大事だと思う。 データ形式によって、そのデータに関する回答精度がどうかわるかという調査がある。 Which Table Format Do LLMs Understand Best? (Results for 11 Formats) HTMLまでの上位5形式はキーワードによってレコードが区別される。JSON以降は記号や改行によってレコードが区別される。また、上位4形式ではキーと値が一緒に書かれる。 このように、表現形式でAIによる読み取りの精度は変わる。GPT-4.1-nanoなので失敗しやすいということはあるだろうけど、どう書いても同じというわけではない。 OpenAI公式のGPT-5コーディングチートシートでも、構造はMarkdownよりXMLがいいと書いてあるし。というか、恐ら
fukabori.fmのtwadaさん回、面白いなー分かるなーって思いながら聞いて、今の自分の頭の中を書きだしてみようと思ったので書いておく。 どのくらい生成AIに任せているかをあらわす指標 どのくらい生成AIに任せているかをあらわす指標は、こうかなぁと僕は思っている。 「生成されたコードを自分が読んでいない割合」 どれだけたくさん生成AIにコードを書いてもらっていたとしても、生成されたコードを自分が全部読んで理解している場合は、主導権は自分にある。逆に、生成されたコードを全く読んでいなければ生成AIに主導権がある。 右のほうが生産性は上げやすい AIにどれだけたくさんコードを生成してもらったとしても、全部読んで理解しないといけないなら人間がボトルネックになる。右側にいけばいくほど、生成AIに任せられるので生産性は上げやすい。 ただ、右側にいけばいくほど自分がコードを理解していないし、構造
Birgitta is a Distinguished Engineer and AI-assisted delivery expert at Thoughtworks. She has over 20 years of experience as a software developer, architect and technical leader. This article is part of “Exploring Gen AI”. A series capturing Thoughtworks technologists' explorations of using gen ai technology for software development. The discourse about to what level AI-generated code should be re
Important details about GPT-5-Codex and this guide: This model is not a drop-in replacement for GPT-5, as it requires significantly different prompting. This model is only supported with the Responses API and does not support the verbosity parameter. This guide is meant for API users of GPT-5-Codex and creating developer prompts, not for Codex users, if you are a Codex user refer to this prompting
2025年9月15日に出たCodex(GPT-5-Codex)めっちゃいいですよね。Claude Codeと併用を始める人も多いのではないでしょうか? しかしいくら性能が良くても、日本国内ではClaude Codeの方がツールや知見が整っているのが現状です。 そこで、これさえ知ってればすぐに快適なCodexライフを始められる、最低限のおすすめ設定&リンク集をまとめました。 「Codex使うけど、おすすめの設定知りたい!」という方、ぜひご覧ください。 前置き そもそもCodexそんなにいいの?って方は、こちらの比較記事をどうぞ。 業務でも使ってますが、コード品質は確実にCodexの方が上です。 インストール、使い方 こちらの記事がわかりやすいと思います。 ChatGPTのサブスクで使えます。 MCP Context7とSerenaはよっぽどの理由がない限り導入必須です。 MCPについてはこち
OpenAI が公開している GPT-5 Prompting Guide を読みました。エージェントやコーディング支援に LLM を活用する上で、参考になる点が多かったので自分なりに整理しておきます。GPT-5 の内容とはなりますが、他の推論が強化された LLM でも参考になると思います。 cookbook.openai.com GPT-5 プロンプトガイドの要点 思考(reasoning)の最適化 ツール利用の明示 思考の再利用 コーディングにおける最適化 指示によく従わせるための工夫 Structured Output コーディングエージェントに応用する実践アクション Context の最適化:思考過程をテキストに書き出させる コンテキストを支援するツールを利用する プロンプトの粒度/視点を調整する GPT-5 プロンプトガイドの要点 プロンプトガイドを読むと、全体を通じて、GPT-5
みなさんこんにちは、XI本部エンジニアリングオフィスの佐藤太一です。 このエントリでは、私がRustで実装したJava用バージョンマネージャであるKopiを紹介すると共に、実装の過程で得た生成AIを使ったソフトウェア開発に関する知見を共有します。 Kopiのソースコードとドキュメントは全てClaude Codeによるものです。私自身は開発環境の構築とメンテナンスをしながら、プロンプトによる指示のみで、約2か月弱の期間に約四万行のRustコードと約六千行のMarkdownを書き上げました。行数の計測においては、コメントや改行は除いています。 成果物は全てオープンソースソフトウェアとして公開していますので、興味を持ったら是非、公式サイトに来てください。 https://kopi-vm.github.io/ Kopiの紹介 ここでは簡単にKopiを紹介させてください。 Java用バージョンマネー
CerebrasがQwen3 Coderのホストをして2000tok/secを出してるという話があって、試したいなぁと思ってたのですよ。 Qwen3 Coder 480B is Live on Cerebras ただ、$50/monや$200/monの定額プランは早々に売り切れ。 けど、1M tok/dayまで無料という噂を聞いて、使ってみることにしました。 で、以前つくった雑なエージェントを試す。 Tool Useが効かないDevstralでコーディングエージェントを作る - きしだのHatena そしたら、3秒でSpring BootでのTODOアプリが!これ、ほんとにこの速さで生成してます。 といいつつ実際に計測すると2000tps出ないんでは、とか思ってたら逆で、2600tok/sec出ていました。 いま、Claude Sonnet 4は70tpsくらいですね。 https://o
並列モード 事前準備: Google Calendar Tasks に乱雑にメモを書き留めてる 特にやることを決めずに tmux(or zellij) で3分割で並べる メモを拾って投げ込む ログが止まってないかだけを見ている メインタスクのトークン消費を圧迫しない範囲で、他タスクの流量を調節 Approaching Usage Limit... がでてないと、仕事してる気にならない アイデアモード 並列モードの一つを「思いつきための実験するための枠」に 「このURL/論文読んで、試しに実装して再現して」 「こういう Lint プラグインがほしいんだけど作れる?」 「WebGPU で pytorch 移植できる?」 重要: 中身をまったく見てない 一通り走りきった後で、どのように成功/失敗したかを確認 うまくいったらGitリポジトリや利用単位に切り出す ゴール設定からワークフロー設計 ゴー
7月15日、John Whilesが「AI slows down open source developers. Peter Naur can teach us why.」と題した記事を公開した。この記事では、AIコーディングツールが熟練オープンソース開発者の生産性を19%低下させた理由を、「メンタルモデル」という視点から解き明かしている。以下に、その内容を紹介する。 研究結果――「速くなる」と信じた開発者ほど遅くなる現実 Metrの論文によれば、被験者となった経験豊富なOSS開発者は、AIツールの使用を許可された課題で平均19%長く作業時間を要した。開発者は事前に「24%高速化する」と予測し、実験後も「20%は速くなった」と誤認したままだった。 When developers are allowed to use AI tools, they take 19% longer to com
前回の更新から2年半が経過し、競技プログラミング/AtCoderと、生成AIの関係も大きく変わりました。競技プログラミングの伝道師として、ここを誤魔化すのは非常に良くないと考えていますし、出来るだけ客観的な事実を用いて現状を説明したいと思います。 長くて読めない人へのまとめ o1の登場で以前よりとても強くなった。参加者の中でも上位に入るように。 Algorithm / Heuristic両部門でそこそこ強い。人類最強には程遠いが、少なくともコンテスト参加者の中央値よりはかなり上。普通の参加者が追いつくのは難しくなった。 AtCoderは、OpenAIを世界最高峰の大会に招待し、AI vs 人間を開催する AIがAtCoderを攻略すると、様々な最適化問題を自動で解決できるようになる可能性が高い。そのためAtCoderは、SakanaAIと協力して、AHCのベンチマークを作成した。 AtCo
最近Claude Codeなどのコーディングエージェントによる開発が非常に便利になっていて、何か作りたいなと思ったら今までにないスピードで開発ができるようになった。自分だと https://github.com/shibayu36/mysql-schema-explorer-mcp はCursor AgentやClaude Codeでかなりの部分を開発した。 コーディングエージェントによる開発をいろいろ試して思ったことは、とにかく楽しすぎるということ。自分がこういうものが欲しいなと思ったら、今までにないスピードで魔法のようにできあがる。モノづくりという側面だけでプログラミングを見た時に、面倒な部分をすべてすっ飛ばしてどんどん作れてしまう。この魔法のようにできあがる体験はとにかく楽しい。 一方で、この楽しさは一種の麻薬のようにも感じる時もある。コーディングエージェントによる開発をしていると、
AI によるコーディングの支援はコード補完型からチャット型、そして自律型へと進化しています。この記事では現時点で主流となっているコーディングエージェントの種類とその特徴を整理したうえで、エンジニアの仕事の変化について考察します。 コーディングの仕事における AI 技術の関わりといえば、GitHub Copilot を代表するエディタ補完型が主たるものとして認識されてきました。補完型の AI はユーザーが途中まで書いたコードを補完する形で提案を行うことから、ペアプログラムの相方のような存在として捉えられていました。例えば function add と書き始めると、AI は (a: number, b: number): number { return a + b; } といった形で関数の定義を提案します。ユーザーは Tab キーを押すことで提案を受け入れたり、提案が気に入らなければそのままコ
tskaigi で発表した https://tskaigi.mizchi.workers.dev/ のコピペしやすい用にしたバージョンです。 ほぼ marp のソースコードそのままですが、プロンプトのコピペ用にそのまま公開します。 本資料の内容 うまくいくプロンプト うまくいかないプロンプト、その理由 現状認識 注意: 前日リリースのClaude 4 の評価は間に合ってません!!!! Claude 4 Opus の高すぎる怖い 数時間触った感じ: 改善傾向だが、抱えてる問題も同じ傾向 主張: 言語特化プロンプトが必要(今は) Coding Agent は言語ごとのユースケースに最適化されていない ベストプラクティスをユーザーが取捨選定する必要 TS 周辺は技術選定で発散しがち プログラミング言語間の転移学習は不安定 GitHub を丸暗記しても、コンテキストに応じて翻訳&参照できるかは別の
はじめに @t_wadaさんの 「Agentic Coding とは Reconciliation Loop である」 という金言を踏まえて、自分なりに咀嚼し、この前提でよりよくAgentic Codingを実現するための実装パターンを考察した内容となります。 「ここで記載した実装パターンでAgentic Codingが上手くいった!」…というもの ではない ことにご留意ください。あくまで私的な考えをまとめたもので、現在進行形で自分自身で試行錯誤しているものになります。(※なお現時点では良さそうに思えます!!) 対象読者 「Agentic Coding」に興味があるエンジニア 「Agentic Coding」を推し進めたいが、どう進めていけば良いか悩んでいる方 結論 「Always-Valid Domain Modeling」「Type First」「関数型プログラミング」「Event S
Vibe Codingとは、AIに身を委ねて、バイブス、感覚でコーディングする手法のことだ。LLMの生成するコードを無条件に信じ、その積み重ねでソフトウェアを作る。理想的には、「こんなものを、いい感じで」とAIに頼むだけでコードができあがる、夢のノーコード開発環境のことを指すのだろう。 現実としては、そんな簡単にはいかない。AIは私たちの心を読む超能力者ではない。「いい感じ」と言っただけではAIはただ適当に振る舞う。まず実現したいことの明確なビジョンと、それを支えるしっかりした設計が必要になる。それをAIが理解できる言葉で、適切にタスク分解して伝えなければならない。今のところ、ただ要望を並べただけでまともなコードができあがることはまれだ。 Thoughtworksが行った実験が、この現実をよく示している。彼らは「システム更新プランナー」というアプリケーションをAIに作らせる実験を、3つのア
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く