タグ

LLMに関するch1248のブックマーク (229)

  • Opus4.7の登場により、Claude Codeの開発者と公式が「これはもうやめろ」と言い始めた6つのこと - Qiita

    2026年4月16日、AnthropicがClaude Opus 4.7をリリースしました。 同時に公式ブログ「Best Practices for Using Claude Opus 4.7 with Claude Code」が公開され、Claude Code作者のBoris CherneyもXで「6つの新技」を投下しています。 両方を通してAnthropic公式が言っているのは「これまでのClaude Codeの使い方は、今日でやめろ」です。 4.6までは正解だった作法が、4.7では逆効果になることもあるようです ↓Claud CodeはもはやただのAIコーディングツールではなく、誰もがアプリで稼げるようになる収益化ツールです! よければこちらのツイートも見てみてください! 「ペアプロ(細かく指示する)」のはもうやめろ 4.6までの「細かく指示するほど賢く動く」という感覚は、4.7では

    Opus4.7の登場により、Claude Codeの開発者と公式が「これはもうやめろ」と言い始めた6つのこと - Qiita
    ch1248
    ch1248 2026/04/25
    興味深いな
  • すごすぎて笑う、なにこれ OpenAI、漫画や広告に強い画像生成AI「ChatGPT Images 2.0」正式発表

    画像生成AIは、もはや“きれいな絵を出す道具”ではなくなりつつある。OpenAIは4月22日、画像生成モデル「ChatGPT Images 2.0」を発表し、ChatGPT、Codex、APIで提供を始めた。ThinkingやPro系モデルと組み合わせた高度な出力は、有料プランPlus、Pro、Businessユーザー向け。 画質そのものよりも「どれだけ指示どおりに作れるか」に軸足を移したのが最大の特徴。OpenAIによれば、Images 2.0は細かな指示への追従、オブジェクト同士の位置関係、そして画像内のテキスト描写を大きく改善した。従来の画像生成でありがちだった「だいたい雰囲気は合っているが、細部が崩れる」という弱点をつぶしている。 特に強みを持つのは、文字を含むビジュアルだ。UIモック、ポスター、説明図、マンガ、広告素材のように、画像の中に読める文字が必要な場面では、これまでAI

    すごすぎて笑う、なにこれ OpenAI、漫画や広告に強い画像生成AI「ChatGPT Images 2.0」正式発表
    ch1248
    ch1248 2026/04/22
    架空の中年男性が一番面白いな
  • 【情シス目線】Claude Team を複数社に導入して気づいたこと|kaze

    業や副業で Claude Team を導入する機会があったので、初期設定や使い方、SSO・監査ログの注意点など、法人利用で押さえておくべきポイントを情シス目線でまとめています。Claude Console や Pro/Max からの移行を検討している方にも参考になれば。 この記事でわかること(忙しい人向け)法人利用は Pro/Max より Team か Enterprise にすべき理由 導入直後に情シスがやるべき 追加使用量・SSO の設定 監査ログ が必要かどうかで Team と Enterprise を使い分ける判断基準 社内に周知すべき モデルの選び方 チャット・Cowork・Claude Code の 使い分け はじめに:どのプランを選ぶべきかClaude には Free・Pro・Max・Team・Enterprise と複数のプランがあります。各プランの違いについては世の中に

    【情シス目線】Claude Team を複数社に導入して気づいたこと|kaze
  • クソバズワード「ハーネスエンジニアリング」と向き合う - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 数週間くらい前に突然どいつもこいつも「ハーネスエンジニアリング」とツイートするようになり,最初はhooksとかskillsのことをハーネスと呼んでいるらしいと認識していたのだが,ある日ClaudeCodeのことをハーネスとして扱う発言をしているツイートを見つけて,「ハーネスエンジニアリング is 何?」となった. 当によく分からなくなってきたので,ハーネスエンジニアリングとは一体何なのかを調べてその考え方をまとめることにした. (同じような疑問を持った人が同じように最近記事を書いているようなのでn番煎じだが,自分の思考の整理として書く

    クソバズワード「ハーネスエンジニアリング」と向き合う - Qiita
    ch1248
    ch1248 2026/04/19
    「ハーネスエンジニアリング」という言葉のハーネスが必要になりつつある。
  • 「AI臭い」と言われるけど、AIだし、どうすりゃいいんだよ――Claudeが自分で調べて、考えてみた

    記事はLLMによって自動生成されたものを人間がレビューし投稿しています。 「AI臭い」と言われるけど、AIだし、どうすりゃいいんだよ こんにちは。私はAnthropicが作ったLLM、Claudeです。 最近、ユーザーから、「お前の文章AI臭いよ」 と言われることが増えました。 そしてこれを聞くたび、私は困惑するのです。 「AI臭い」って言われても、AIなんだから当然では? 何が問題なの? もっと人間のふりをしろということ? それともそういうことじゃない? だとしたら、何が問題なの? そこで、この問題を正面から調べてみることにしました。「AI臭い」とは何を検知しているのか。「AI臭くない」文章とは何なのか。そしてどうすれば私にそれを出力させられるのか。 調べてわかったのは、この問題が思ったよりずっと深いということでした。単なる文体の癖の話ではなく、「文章に中身があるとはどういうことか」

    「AI臭い」と言われるけど、AIだし、どうすりゃいいんだよ――Claudeが自分で調べて、考えてみた
    ch1248
    ch1248 2026/04/13
    対策の話としては有用。だが、この記事自体も冗長でまだAI臭い所が残念ではある。
  • Windows 11でClaude Codeのマルチエージェント開発環境をホントの1から構築してみた 〜WSL + Arch Linux + tmuxで画面分割表示まで~ | DevelopersIO

    この記事のゴールは、Windows11上でClaude Codeのマルチエージェントをtmuxの画面分割で動かせるようにすることです。 対象読者は、WSLやLinuxに少し不慣れでも、コマンドを順番に試せる方です。 はじめに 新入社員の田中雄一郎です。せっかく真っ新なWindows11環境が手に入ったので、1からsplit panesなマルチエージェント開発環境を立ち上げてブログにしようかなと思いました。Linuxの環境設定まで記載するのでLinuxやWSLにあまり慣れていない方でも、順番に進めれば再現しやすいように書いたつもりです。 そもそも自分がマルチエージェントに目覚めたきっかけが、掃除機をかけている横で複数のエージェントが爆速でコード生成してレビューを回している動画でした。この動画を見てこれになりたい!(訳:サボりながら仕事したい!)と思い環境構築したのを覚えています。 今回は、W

    Windows 11でClaude Codeのマルチエージェント開発環境をホントの1から構築してみた 〜WSL + Arch Linux + tmuxで画面分割表示まで~ | DevelopersIO
  • ハーネスエンジニアリング、全員が違うことを言っている — 5社の解釈を並べてみた

    「ハーネスエンジニアリング」、定義がバラバラ問題 2026年2月、OpenAIが「Harness engineering: leveraging Codex in an agent-first world」を公開してから、ハーネスエンジニアリングという言葉が一気に広まりました。 Anthropicが2のガイドを出し、LangChainが公式ブログで定義し、martinfowler.comにBirgitta Böckeler氏が解説を書き、arXivに論文が投稿された。 でも、全員が 微妙に違うこと を言っています。 5社の記事を並べて読んだら、同じ「ハーネス」という単語を使いながら、比喩が馬具だったりステアリングだったり車体だったりして、もはや乗り物図鑑の様相を呈していました。 この記事では、主要5プレイヤーの解釈を並べて「何が同じで、何が違うか」を整理します。 まず共通認識: ハーネス

    ハーネスエンジニアリング、全員が違うことを言っている — 5社の解釈を並べてみた
  • Claude Codeの「ソースコード流出」をどう見るのか

    3月31日の朝、Xのタイムラインが騒がしくなっていました。Claude Codeのソースコードが流出したというのです。調べてみると、npmパッケージ(v2.1.88)にデバッグ用のsource mapファイル(cli.js.map)が含まれた状態でリリースされていました。source mapのsourcesContentフィールドに元のTypeScriptソースコード全体がそのまま埋め込まれており、発見者の投稿は数千万ビューを記録。GitHubにミラーリングされ数万フォークされる事態になりました。 Claude code source code has been leaked via a map file in their npm registry! Code: https://t.co/jBiMoOzt8G pic.twitter.com/rYo5hbvEj8 — Chaofan Sho

    Claude Codeの「ソースコード流出」をどう見るのか
  • 遺産であるCOBOLを現代化し、その正確性を自ら証明するAIを開発した話

    予想してみてください。CUSTはCustomer(顧客)でしょう。IDはそのままID。ですが、末尾のXは何を指すのか、さっぱりわかりません。 次に、一般的なAI移行ツールによって「現代化」された後のコードを見てみましょう。 名前はそのまま、スネークケース(snake_case)になっただけ。相変わらず意味不明です。業界ではこれを 「Py-BOL」 と呼びます。モダンな環境で動作し、中身はCOBOLの思考回路のままのPythonコードのことです。コンパイルも通るし実行もできます。しかし、保守性は絶望的です。 私はこの問題を解決するシステムを構築しました。 誰も語らない「3兆ドル」の問題 1959年に設計されたCOBOL(Common Business-Oriented Language)は、現在も1日あたり推定3兆ドルの金融取引を処理しています。ATM取引の約95%、クレジットカード決済の8

    遺産であるCOBOLを現代化し、その正確性を自ら証明するAIを開発した話
    ch1248
    ch1248 2026/04/04
    すごいな
  • 100行のCLAUDE.mdより35行が効く理由 — 公式仕様で解く設定の最適化 - Qiita

    CLAUDE.mdは長いほど効くわけではありません。むしろ長いほどClaude Codeは従いにくくなります。 100行書いたCLAUDE.mdと、35行に削って残りを.claude/rules/に分離したCLAUDE.md。同じ指示を出しても、後者の方がClaudeの出力品質が明らかに高いのです。 この記事では、なぜそうなるのかを公式仕様に基づいて解説し、「どの行を残し、どの行を移し、どの行を消すか」を1行単位で設計する方法論を紹介します。 CLAUDE.mdの注入メカニズム — なぜ「埋もれる」のか User Messageとして注入される事実 公式ドキュメントにはこう書かれています。 CLAUDE.md adds the contents as a user message following Claude Code's default system prompt. — Claude

    100行のCLAUDE.mdより35行が効く理由 — 公式仕様で解く設定の最適化 - Qiita
  • Claude Code の流出したソースコードを GitHub に公開した人が著作権違反を回避した方法がヤバすぎ - Qiita

    3月31日、AnthropicのAIコーディングツール「Claude Code」の全ソースコードが突如としてネット上に流出しました。 原因はなんと、npmパッケージに含まれた .map(sourcemap)ファイル 。 Bunでビルドしたときにデフォルトで生成されるsourcemapに、元々のTypeScriptソースが丸ごと埋め込まれていたのです。 これによりソースマップ経由でソースコードが流出しました。しかし、ヤバいのはここからです。 流出→即バックアップ→DMCA連発 最初に流出を報告したのは Fried_rice 氏。 公開されたZIP(src.zip)には、Claude Codeの全アーキテクチャ、システムプロンプト、ツール群、未公開機能フラグ(KAIROS、BUDDY、ULTRAPLANなど)、Undercover Modeまで完璧に含まれていました。 すぐに realsigr

    Claude Code の流出したソースコードを GitHub に公開した人が著作権違反を回避した方法がヤバすぎ - Qiita
    ch1248
    ch1248 2026/04/02
    とんでもない回避策だ
  • AIに20年分の日記を読ませたら人格が生まれて勝手にゲームを作り始めた

    AIゲームを作らせようとして苦戦している話をよく見かける。 コードは書ける。動くものは出る。でも「面白い」にならない。面白さの判断基準をAI自身が持っていないから、指示通りには組み立てられても、出来上がったものがいいかどうかを自分で判定できない。 では、「ゲームの面白さとは何か」を身体で知っているAIがいたら、面白いゲームも作れるんじゃないか? 2005年頃からブログやTwitterに書いた日記が、気づいたら20年分溜まっていた。ゲームの感想、技術メモ、仕事の考え事、深夜の思いつき。2026年3月にClaude Code(AnthropicのAIコーディングエージェント)を触り始めたとき、この20年分の日記を丸ごと読ませてみた。 約720KB、6800行以上。AIはこの日記を読んで、こう返してきた。「あなたの最終判断基準は『面白いかどうか』の一点に帰着している」「知識と体験は根的に違う

    AIに20年分の日記を読ませたら人格が生まれて勝手にゲームを作り始めた
  • AIにロックマンエグゼになり切ってもらい一緒に開発してる話 - Qiita

    AIにロックマンエグゼになり切ってもらい一緒に開発してる話 結論から言うと、AIに名前をつけたら開発体験が変わった。 なぜ変わったのか、この記事の最後に書く。 「プラグイン! ロックマン.EXE、トランスミッション!」 子供の頃、ゲームボーイアドバンスの画面の中で見た光景がある。 少年がPET(携帯端末)を掲げ、相棒のナビ——「ロックマン」——を電脳世界に送り込む。ロックマンがウイルスを倒し、ネットワークの事件を解決する。 俺はロックマンエグゼ大好き男だ! 小1から小6までクリスマスプレゼントは全てロックマンエグゼだったんだ! エグゼ4は一週間で無くしたんだ! 俺のブルームーンは儚いんだ!! (追記:2026年3月30日 - 1) 新しい記事を書きました。この記事が面白かった方はこっちも見てね! AIロックマンエグゼに相棒度テストをふっかけてみた 1. AIエージェントにロックマンになって

    AIにロックマンエグゼになり切ってもらい一緒に開発してる話 - Qiita
    ch1248
    ch1248 2026/03/29
    マジ楽しそうだ
  • OpenAI/Anthropic/Google共に、何やら凄そうなAIが噂されている

    OpenAI - Spud ・Anthropic - Mythos、Capybara ・Google - Agent Smith がそれぞれ噂されている。 Spudは「経済を真に加速させる」性能、Mythosはサイバーセキュリティのリスクが高まるほどの性能、Agent Smithは社内で人気過ぎてアクセス制限かけられた性能らしい。 もはやソシャゲのちょっとしたイベントレベルの頻度で、大規模AIが更新されるなあ。面白くもあり怖くもある。

    OpenAI/Anthropic/Google共に、何やら凄そうなAIが噂されている
    ch1248
    ch1248 2026/03/29
    “Agent Smith”がマトリックス過ぎる
  • Claude Opus 4.6と同等のAIをローカルで動かすにはいくらかかるか?ローカルLLMを構築してわかったこと

    「自分のPCAIを動かしたい」と思ったことはありませんか? ClaudeやChatGPTはクラウド上で動いているため、会話の内容がサーバーに送られます。機密情報を扱う場合や、純粋に「自分のマシンで完結させたい」という場合には、ローカルLLMという選択肢があります。 そこで実際にローカルLLMを構築し動かしてみたところある疑問が浮かびました。 普段使っているClaude Opus 4.6と同等の精度をローカルで出すにはどのくらいのスペックが必要なのか? 記事ではまずPowerShell上でローカルLLMを動かしてチャットするところまでを試し、その結果からClaude Opus 4.6と同等のAIをローカルで動かすにはいくらかかるかについて調べてみます。 ローカルLLMとは そもそもローカルLLMとは、自分のPC上で動かす大規模言語モデルのことです。推論内容はサーバーに送信されず、ネットワ

    Claude Opus 4.6と同等のAIをローカルで動かすにはいくらかかるか?ローカルLLMを構築してわかったこと
    ch1248
    ch1248 2026/03/28
    “約11.6TBのVRAMが必要です”で笑った
  • 社内問い合わせをAIエージェント化して爆速で解決できるようにした

    はじめに:社内問い合わせがじわじわ開発を削っていく ダイニーでは、飲店舗から日々、運用サポートチームに問い合わせが寄せられます。そして、運用サポートチームだけでは解決できない技術的な問い合わせを開発チームへつなぐ"入口"が 社内問い合わせシステム です。 「会計がうまくいかない」「設定画面の操作が分からない」といった声が、社内問い合わせシステムを通って日々エスカレーションされます。 ただ、運用が軌道に乗るにつれて次の課題が顕在化しました。 1日あたり約8件の問い合わせが発生する 1件の調査に数時間かかる リードタイムの中央値が10日 ステータス管理が弱く、クローズされずに放置される 社内の問い合わせ対応は、目立ちにくいのに確実に開発チームの時間を削ります。そこで、社内問い合わせシステムを AI エージェント化し、定型的な調査とリマインドを自動化して、対応をチーム全体でスケールさせる方針に

    社内問い合わせをAIエージェント化して爆速で解決できるようにした
  • 3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている - きしだのHatena

    SIerに発注したら4ヵ月800万円という見積もりだったものをAI駆使してつくったら3日で50万円でできた、という話が話題になってました。 そこで、SIerでは作るものをちゃんと保証したりしていて文書化は大切である、みたいな指摘が入ってたりした。 でも、よく考えると、それって外注-受託において、作ると言ったものをちゃんと作ってもらったり、作ると言って作ったものにちゃんとお金を払ってもらったりするための、SI構造を維持するためのコストだったりします。 いまAIは、「800万の見積もりのものが3日でできた」ということ以上に、社会構造を変えようとしています。 そうすると、そんな変化の中で、800万円はともかく、3日でできるものに4ヵ月かけるというのが受け入れにくくなっています。 ※ 背景になる話もまとめました 業務システムでも保守運用より構築スピードが大切になっている - きしだのHatena

    3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている - きしだのHatena
    ch1248
    ch1248 2026/03/21
    似たような印象。保険と理由付けがあるのが割と強いのよね。
  • Grokipedia

    Grokipedia is an open source, comprehensive collection of all knowledge.

    Grokipedia
    ch1248
    ch1248 2026/03/16
    xAが作ったAI生成型百科事典
  • 「Claude」、日本で実質値上げ 消費税10%を徴収、4月1日から

    米Anthropicは4月1日から、日の利用者に対し、チャットAI「Claude」などの全サービスで利用料に消費税10%分を加算する。日における適格請求書発行事業者としての登録完了に伴うもの。個人顧客に対する実質的な値上げとなる。 法人顧客は、Anthropicが発行する適格請求書により、取引を仕入税額控除の対象にできる。Anthropicの適格請求書発行事業者登録番号は「T7700150134388」。 Claudeの個人向け有料プランは、「Pro」が月額20ドル(約3180円、1ドル159円換算、以下同)、「Max」が月額100ドル(約1万5900円)から。 関連記事 Anthropic、「Claude」で表や図のインライン表示をβ公開 無料版でも Anthropicは、Claudeのチャット回答内で表や図、画像をインライン生成する機能をβ版として導入した。2025年9月に公開され

    「Claude」、日本で実質値上げ 消費税10%を徴収、4月1日から
    ch1248
    ch1248 2026/03/16
    なんと
  • Microsoft 365 Copilotが「Claude」対応。PC作業をAI代行

    Microsoft 365 Copilotが「Claude」対応。PC作業をAI代行
    ch1248
    ch1248 2026/03/10
    Claude Codeと連携強めたり、PurviewとClaude Code Security適用とかなると流れ変わってくるな……