はじめに こんにちは、AIにレビューを任せてたらいつしか自分がレビュー対象になっていました。たろう眼鏡です。 Karpathy氏が公開した autoresearch をご存知でしょうか。AIエージェントにLLMの訓練コードを渡して放置すると、勝手にモデルを改善し続けてくれるというリポジトリです。 これを見たとき、「この仕組み、サーバーサイドのパフォーマンスチューニングにも使えるのでは?」と思いました。コントローラーが遅い → コードを直す → ベンチマークを取る → 良くなったら採用、ダメなら戻す。これは日常的にやっている作業ですが、1塁ベースに全力でヘッドスライディングするような泥臭いものです。 1塁にヘッドスライディングするのはAIに任せて10分ごとに自動で回させたら、寝ている間に数十回の改善サイクルが走ります。ただし、AIに自律的にコードを触らせるには「暴走しない仕組み」が必要です。

