タグ

moronbeeのブックマーク (16,973)

  • 未公開AI「Claude Mythos」の謎。正しい読みは「ミソス」か「ミュトス」か | Business Insider Japan

    こちらはBusiness Insider Japanの無料ニュースレターに掲載されたコラムです。無料ニュースレターでは、日替わりで編集部員がコラムを執筆しています。Tech Insiderの振り返りコラムは、毎週金曜日に配信しています。ニュースレター(無料)に登録する先日、アンソロピック日法人の広報から届いたメールをXに投稿したところ、大きな反響がありました。 内容は、現時点では未公開のAIモデル「Claude Mythos」の日でのカナ表記と読みが「クロード・ミュトス」である、というものです。 Anthropicの広報担当者からメールが なるほろ? 先日Anthropicが発表いたしました「Claude Mythos」につきまして、日語でのカナ表記を下記の通りご案内いたします。 正式表記(英語) Claude Mythos 日語でのカナ表記・読み仮名 クロード・ミュトス — ゆう

    未公開AI「Claude Mythos」の謎。正しい読みは「ミソス」か「ミュトス」か | Business Insider Japan
    moronbee
    moronbee 2026/05/02
    正式表記(英語) Claude Mythos 、日本語でのカナ表記・読み仮名 クロード・ミュトス
  • 品質の言語化のススメー早期テストの原則をClaude Code Agent Skillsで実現する試み - LayerX エンジニアブログ

    LayerX QAエンジニアの小山です。 昨今、AIコーディングアシスタント(特にClaude Code等)の進化により、コードの実装やテスト追加のスピードが飛躍的に向上しています。しかし、AIにコードを書かせる際に「どこまで厳密なエラーハンドリングが必要か」「テストはどの程度書くべきか」といったことに迷われた経験はないでしょうか? 今回は、バクラク事業部の品質の定義やテスト戦略などを言語化し、Claude Codeが動く際にリスクの高い箇所を守るように動いてもらい、テストも同時に生成してもらう、早期テストで時間とコストを節約する試みについてご紹介します。 ソフトウェアテストの原則「早期テストで時間とコストを節約する」 筆者はJSTQB FLの公認コースのトレーナーを15年ほどしているのですが、JSTQB FLシラバスの中に「テストの原則」として7つの原則があります。その中の1つとして「早

    品質の言語化のススメー早期テストの原則をClaude Code Agent Skillsで実現する試み - LayerX エンジニアブログ
  • マネーフォワードのGitHub不正アクセス事件をエンジニア視点で読み解く — なぜソースコードに本番カード情報と認証キーが入っていたのか

    マネーフォワードのGitHub不正アクセス事件エンジニア視点で読み解く — なぜソースコードに番カード情報と認証キーが入っていたのか はじめに 2026 年 5 月 1 日、マネーフォワードが「GitHub への不正アクセス発生に関するお知らせとお詫び(第一報)」を公表しました。GitHub の認証情報が漏えいし、第三者によりリポジトリがコピーされ、ソースコードと一部の個人情報が流出した可能性があるという内容です。同時に、銀行口座連携機能を一時停止する措置もとられました。 この事案は、エンジニア視点で見ると「仕方ない部分」と「明らかにアウトな部分」がはっきり分かれる、教科書のような事例になっています。GitHub 認証情報の漏えい自体は、正直に言ってどの会社でも起こり得ます。一方で、流出したとされる中身に 番カード保持者の氏名と下 4 桁が 370 件、そして ソースコード内に各種認

    マネーフォワードのGitHub不正アクセス事件をエンジニア視点で読み解く — なぜソースコードに本番カード情報と認証キーが入っていたのか
  • 【検出率100%】セキュリティ診断、Claude Codeに全部やらせる時代が来た

    はじめに 前回の記事で /security-scan を作った後、こんな気持ちになりました。 「これ、デプロイ前の静的解析と、デプロイ後の動的テストが混ざってないか?🤔」 そのとおりで、1スキルに詰め込みすぎていました。 今回は 3スキルに分割してOSSとして公開、さらに テストハーネスで精度を客観測定 するところまでやりました。 まず費用対効果だけ見てください 従来手段 claude-security-scan(3スキル)

    【検出率100%】セキュリティ診断、Claude Codeに全部やらせる時代が来た
  • 高市首相 ナフサ由来の化学製品 年越えて供給継続できる見込み | NHKニュース

    高市総理大臣は、プラスチックなどの原料となる「ナフサ」に由来する化学製品について、中東以外からの調達を進めるなどした結果、年を越えて供給を継続できる見込みになったと明らかにしました。 政府は30日…

    高市首相 ナフサ由来の化学製品 年越えて供給継続できる見込み | NHKニュース
    moronbee
    moronbee 2026/04/30
    人々を勇気づけ鼓舞する文系(感情)リーダーか、数字を冷静に分析し先を見通す理系(論理)リーダーかで言うと明らかに文系。万全の体制で強力に推し進めて参りますと言われても、論拠に対する信頼がないんよ。
  • トランプ氏支持率34%、今任期で最低 生活費高騰に不満=調査

    [ワシントン 28日 ロイター] - ロイター/イプソスの世論調査によると、トランプ米大統領の支持率は任​期中の最低水準に低下した。生活費高騰への対応‌や対イラン戦争に対する国民の不満の高まりを受けた。 27日に終了した4日間の世論調査によると、トランプ大統領の職務パフォーマンス​を支持する国民は34%と、4月15─20日に実施した前回調査の36%から低下した。​トランプ氏の支持率は、2025年1月の就任時に47%を記録したが、⁠その後は低下傾向が続いている。

    トランプ氏支持率34%、今任期で最低 生活費高騰に不満=調査
    moronbee
    moronbee 2026/04/30
    これだけの状況でも支持が34%もあるのに驚愕
  • Claude Code に仕事を譲った日——残ったのは「判断」と「責任」だった

    はじめに 私はもともとIS(インサイドセールス)、いわゆる営業サイドの人間だった。 コードは書けない。SQLも知らない。ターミナルを開いたこともなかった。そんな自分が、ある日開発部のCRE(Customer Reliability Engineering)チームに異動した。 CRE仕事は、お客様からの技術的な問い合わせを調査して回答すること。「承認フローが変わってしまった」「エクスポートが終わらない」「メールが届かない」——毎日そういった問い合わせがJiraに積まれていく。 調査には、DBへのクエリ実行、Rails/Reactのコードリーディング、ログの解析が必要になる。正直に言うと、最初は「自分にできるのか」という不安しかなかった。 でも今、私のPCでは毎時0分にClaude Codeが自動で起動し、Jiraから新しいチケットを拾い、コードとDBを調査し、回答ドラフトまで作ってSl

    Claude Code に仕事を譲った日——残ったのは「判断」と「責任」だった
    moronbee
    moronbee 2026/04/30
    調査業務を全自動化するまでの道のりと、その過程で見えてきた"AIには置き換えられない人間の価値"
  • 人間レビューはもう不要? AI と人間のレビューの線引きを決めた話

    はじめに こんにちは!Acsim 開発チームの笹沢です。 AI 駆動開発の浸透でコードの生産量は飛躍的に増えました。一方、人間がレビューに割ける時間は変わらないため、レビュー待ちで PR がスタックする場面が以前より増えていきました。 私たちのチームでは「人間のレビューを必須とするもの」と「AI レビューで OK とするもの」を線引きし、セルフマージ制度として日々の開発に組み込みました。直近では PR の 約 8 割が人間レビューを介さずにマージできています。マージまでのリードタイムも短縮されています。 この記事では、セルフマージ制度の設計と運用上の工夫、導入後の変化を紹介します。AI レビューが十分使えるレベルになった今、自チームのレビュー運用を見直したい方の参考になれば嬉しいです。 すべての PR に人間レビューは必要か 最近の AI レビューはコード品質の担保という意味では十分使える

    人間レビューはもう不要? AI と人間のレビューの線引きを決めた話
  • 大規模案件のSlackにAI社員3人を常駐させたら、2年目が参画1週間で設計根本に踏み込んだ

    実際の画面とは異なるサンプルイメージです チームのSlackAI社員を3人常駐させています。 社員5人で、2週間動かしました。 誤解を招きそうだからちゃんと書いておきます。 2週間です。半年でも1年でもなく、2週間。 それでも書きたくなるくらいのことが起きたので、この記事を書いています。 SIerの大規模開発で扱う資料は毎週溜まります。 仕様書の背景、顧客の痛点、過去の判断の残り香。 新しく参画したメンバーは、これを数週間かけて読み込むのがいつもの景色です。 そこに、このAI社員3人が入りました。 すると、2年目のメンバーが参画1週間でSKILLを直し、2週間で設計根に疑問を出してきた。 正直、びびりました。 自己紹介・大規模現場の話を軽く 私はNTTデータグループ 技術革新統括部のITアーキテクト(課長代理)で、大規模システムのモダナイゼーションに携わっています。 全社の高難度案件

    大規模案件のSlackにAI社員3人を常駐させたら、2年目が参画1週間で設計根本に踏み込んだ
  • Anthropicはなぜ異次元の速度で開発できるのか|すてぃお

    「Anthropic(Claudeを作っている会社)、開発が速すぎる」 最近、周りのエンジニアと話していると、この話題がよく出ます。僕も同じことを思っていて、いろいろ調べているうちに、単に「AIを使っているから速い」という一言では説明できない構造があることが見えてきました。 例えば、下記になります。 2026年Q1の3ヶ月で120以上の機能をリリース(18時間に1機能) エンジニア1人あたり1日約5PR(Pull Request、コードの変更を提出する単位) 社内では毎日60〜100回のリリース Claude Coworkは約10日で構築 Claude DesignはOpus 4.7のリリース翌日に公開 普通のソフトウェア開発企業の感覚からすると、明らかに異次元です。この記事では、公開されているインタビューや内部研究、関係者の発言をもとに、「なぜこんなことが可能なのか」というのを調べた限り

    Anthropicはなぜ異次元の速度で開発できるのか|すてぃお
  • 実はここまでできるCoworkハンズオン — Claude Codeに行く、その前に を経て|まつにぃ

    なぜ「Claude Codeに行く、その前に」なのかClaude Codeは、とても強力なエージェントツールです。ローカルファイルを編集でき、コマンドを実行でき、Git操作やMCP連携まで扱えます。実際、開発寄りの業務に限らず、あらゆる業務に適用できるエージェントツールの最有力な選択肢になってきています。 ただし、強い権限を持つツールは、そのまま業務に入れると、考えておくべきことも増えます。どのファイルまで触ってよいのか、社外秘情報や顧客情報をどう扱うのか、意図しない変更が起きたときにどう説明するのか。特に非エンジニアを含む組織展開では、便利さだけではなく、権限設定や運用の説明が必要になります。 今回あえて「Claude Codeに行く、その前に」と置いたのは、Code系のツールを否定したいからではありません。 むしろ逆で、強力なツールに進む前に、まずはAIと一緒に業務を進め、どこまで任せ

    実はここまでできるCoworkハンズオン — Claude Codeに行く、その前に を経て|まつにぃ
  • 10万円を切る唯一のMacBook「Neo」レビュー 良い点と残念な点

    MacBook Neo」は、MacBookシリーズの中で圧倒的に安価でありながら、上位モデルに通じるプレミアムなデザインと堅牢性を備えている。軽量コンパクトで持ち運びやすく、定番のシルバーに加えてポップな3色を用意する遊び心もある。ウェブ閲覧やレポート作成、動画視聴、写真や文章の軽い編集が中心なら、「MacBook Air」や「MacBook Pro」のパワーは過剰だろう。 価格面でもインパクトは大きい。「MacBook Neo」と最も安価な「iPhone」を両方買ったとしても、「MacBook Air」の最安構成を単体で買う場合に比べて、1万4800円高いだけに過ぎない。初めてApple製品をそろえるユーザーや、子ども用にMaciPhoneをまとめて検討する親にとって、この価格差は無視できない。 ただし、10万円切りを実現するために、Appleはいくつかの機能を削っている。もっとも象

    10万円を切る唯一のMacBook「Neo」レビュー 良い点と残念な点
  • 技術ニュースを毎朝スマホで流し読みしたい、だから自分専用サイトを開発した話

    Next.jsは使っていません。更新は1日1回で動的コンテンツもないので、Viteのbuildで十分です。 テストは先に書いて、実装と分けた Claude Codeに実装を任せるときに怖いのは、テストを通すためだけの嘘実装ができてしまうことです。 ダミーデータで埋めたり、assertを弱めたり、skipを入れたりするパターン。 対策として、テスト設計と実装担当を物理的に分けて、最後にクロスレビューするフローにしています。 1. テスト設計担当がテストとスケルトンを先に書く 2. 僕がテスト観点をレビュー 3. 実装担当がテスト全 PASS するまで書く。テストファイルには触らない 4. テスト設計担当がクロスレビュー。テストファイルのmtimeが自分の作業時刻で止まっているかを確認する Python側99テスト、Web側 35テスト、合計134テストで固めました。 mtimeベースの検証は

    技術ニュースを毎朝スマホで流し読みしたい、だから自分専用サイトを開発した話
  • https://www.ebematsu.co.jp/catalogindex_vol26/public/pdf/catalog/1907.pdf

  • ハーネスエンジニアリングとは?

    Harness Engineering Meetup Tokyo #1、TOPバッターとして、ハーネスエンジニアリングについての導入的説明を行いました。

    ハーネスエンジニアリングとは?
  • 【Google Cloud Next ’26】Devin開発元が語るコーディングエージェントが抱える本当の課題 | iret.media

    サスペンド/レジュームの難しさエンジニアリングの観点で特に掘り下げられたのが、サスペンド/レジュームの実装です。 現実のエンジニアリング作業は連続しておらず、エージェントがPRを出すとCI(Continuous Integration)を待ちます。(長くても15〜20分) その後、人間のレビューを待つ必要があり、完全な自動化を考えるとこの間、マシンをアイドルのまま動かし続けるのはコスト的に現実的ではありません。 正しいサスペンド/レジュームには4つの要件があります。 メモリ・ファイルシステム・実行中プロセスを含むフルマシン状態の保存 アイドルセッションのコストがゼロになるようコンピュートをシャットダウン まったく同じ状態・コンテキストで復元 オフライン中に届いたイベント(他のメンバーからのメッセージ等)の調整 上記を正しく実現するにはカスタムのハイパーバイザーレベルでのエンジニアリングが必

    【Google Cloud Next ’26】Devin開発元が語るコーディングエージェントが抱える本当の課題 | iret.media
  • BYD「第二世代ブレードバッテリー」の正体【前編】中国で進むEV超急速充電の技術革新最前線を読み解く | EVsmartブログ

    誰でも参加OK! EVコミュニティ「EVsmart Park」 EV購入の相談から愛車の自慢まで。 リアルな情報を共有しませんか? 今すぐチェック ▶ BYDが第二世代のブレードバッテリーを正式発表してから2カ月近くが経過し、それを搭載する新型モデルの導入とともに、リアルワールドにおける充電テストなど、さまざまな展開内容が明らかになってきています。さらに競合メーカーも続々と超急速充電テクノロジーを発表しています。中国でますます熾烈さを増す超急速充電の技術革新を前後編に分けてまとめます。 ※この記事はAIによるポッドキャストでもお楽しみいただけます! 最大1.5MWの超高出力急速充電という衝撃的ニュース BYDは2026年3月5日に第二世代のブレードバッテリーの発表会を開催しました。BYDジャパンがプレスリリースを発信するとともに、すでにEVsmartブログでは発表会概要の解説記事を公開済み

    BYD「第二世代ブレードバッテリー」の正体【前編】中国で進むEV超急速充電の技術革新最前線を読み解く | EVsmartブログ
  • 内閣官房から指名停止のIPA、再委託先デロイト傘下の不正な行為見つける

    内閣官房が2026年4月に公表した指名停止措置の対象に、情報処理推進機構(IPA)の名があることがSNS(交流サイト)などで話題になっている。IPAが再委託先の契約違反行為を把握し、国家サイバー統括室へ報告したことが発端だった。委託先選定の難しさが浮き彫りになった。 「契約相手方として不適当である」――。内閣官房が2026年4月10日に公表した指名停止措置で、こう指摘されたのがIPAだ。指名停止期間は2026年4月10日から同年9月9日までの5カ月間。この間、内閣官房が実施する競争入札などに参加できなくなる。 IPAは経済産業省のIT政策実施機関として、セキュリティー関連の情報発信や評価制度の運営、デジタル人材の育成などを担う。企業に対し、委託先の情報セキュリティー対策などの啓発もしている。そうした立場のIPAが、なぜ指名停止措置を受けたのか。内閣官房国家サイバー統括室を2026年4月23

    内閣官房から指名停止のIPA、再委託先デロイト傘下の不正な行為見つける
  • ハーネスエンジニアリングの実践は "Thin"と"Self-healing" へ|Seiji Takahashi@ベースマキナ

    皆さまこんにちは、株式会社ベースマキナの代表取締役社長を務めております高橋(@__timakin__)です。 海外のハーネスエンジニアリングの状況をみていると、いかにその実装を薄くするか、そしてself-healingにするか、という言及が増えているように感じます。 ただこれは、単に「機能を減らせ」という話ではないと考えています。事前に予測してハーネスに詰め込む設計から、必要になった瞬間にモデルがハーネスを書き足す設計へ。API 設計そのもののパラダイムシフトとして読める気がしています。今回はそのあたりを少し書いてみます。 browser-harness の self-healingbrowser-harness は、LLM に Chrome を生の CDP 経由で操作させるためのハーネスです。 中身を読んでみたところ、全体で 592 行の Python しかなく、内訳も `run.py`

    ハーネスエンジニアリングの実践は "Thin"と"Self-healing" へ|Seiji Takahashi@ベースマキナ
    moronbee
    moronbee 2026/04/25
    CPUのL1/L2/L3キャッシュ設計や組織の役割分担設計等に見立てて、リソース制限下で効率よく意図する結果を導き出す取り組み
  • セキュリティ監査は死んだ|gohan

    追記: セキュリティ監査の仕事AIに代替されるということを言いたいわけではありません。監査でのチェックに含める項目など、セキュリティがやっていることの全般的な枠組みに変革を余儀なくされるということを書いています。ぜひ最後までお読みいただき、奇譚なき意見をください。 2026年4月、AnthropicはClaude Mythos Previewを公開した。このモデルは数千件のゼロデイを自律的に発見したと報告され、Mozilla Firefox 150はこのモデルで発見された271件の脆弱性を一括パッチした。一方でAI自動ペンテスト企業XBOWはHackerOneのリーダーボードを席巻している。セキュリティ業界は数年以内に、「コードの脆弱性を見つける」という課題をほぼ自動化可能な問題に変えるだろう。しかし、この事実はセキュリティ業界にとって勝利ではない。むしろ、いま売られているセキュリティ

    セキュリティ監査は死んだ|gohan