タグ

ブックマーク / note.com/timakin (8)

  • AIエージェントの性能差のキー、ハーネスエンジニアリング|Seiji Takahashi@ベースマキナ

    皆さまこんにちは、株式会社ベースマキナの代表取締役社長を務めております高橋(@__timakin__)です。 AIエージェントの性能を上げようとすると、まずモデル選定に目が行きます。 Opus 4.6にするか、Geminiにするか。ただ、2026年に入ってからの各社の発表やベンチマーク結果を見ていると、性能差を生んでいるのはモデルそのものではなく、モデルを包む周辺インフラのほうだという話が増えてきました。 この周辺インフラを指す言葉として、ハーネスエンジニアリングという概念が急速に広まっています。 ハーネスエンジニアリングとは何かPhil Schmidが書いた記事のアナロジーがわかりやすいです。モデルはCPUで、ハーネスはOSです。 CPUがどれだけ高性能でも、OSが貧弱ならパフォーマンスは出ません。同じように、LLMがどれだけ賢くても、コンテキスト管理やツール統合、メモリ管理、検証の仕組

    AIエージェントの性能差のキー、ハーネスエンジニアリング|Seiji Takahashi@ベースマキナ
    mkusaka
    mkusaka 2026/03/05
    モデルより周辺インフラの「ハーネスエンジニアリング」が鍵で、ハーネス変更でGrok Code Fast 1が6.7%から68.3%に改善した事例を紹介します。
  • AIエージェントのファイルシステムへの回帰|Seiji Takahashi@ベースマキナ

    皆さまこんにちは、株式会社ベースマキナの代表取締役社長を務めております高橋(@__timakin__)です。 LlamaIndexのJerry Liuさんが「Files Are All You Need」という記事を公開していました。 AIエージェント界隈で「ファイル中心設計」が急速に支持を集めている印象があります。なぜ今、ファイルなのか。あくまで推測ですが、その理由はいくつかあると思います。 新規の学習コストがない1つめは、単純に学習コストの観点です。 LlamaIndexの記事では、LLMが膨大なコードベースで訓練されている点を強調しています。GitHubに上がっているコードの多くには`grep`や`ls`、ファイルの読み書きといった操作が含まれています。つまり、LLMにとってファイルシステムの操作は、わざわざ教え込む必要のない「既知の能力」になっています。 一方で、カスタムのMCPツ

    AIエージェントのファイルシステムへの回帰|Seiji Takahashi@ベースマキナ
    mkusaka
    mkusaka 2026/01/20
    LlamaIndexやVercelを参照し、grepやファイル保存で文脈管理しAnthropic事例では150,000→2,000トークン削減とし、ファイル中心設計の利点と課題を解説する記事。
  • agent-browserに学ぶAI最適なブラウザ操作とツール提供の考え方|Seiji Takahashi@ベースマキナ

    皆さまこんにちは、株式会社ベースマキナの代表取締役社長を務めております高橋(@__timakin__)です。 先日vercel-labs/agent-browserがリリースされました。「トークン消費93%削減」という謳い文句を見て、どうやってそれを実現しているのか気になったので中身を読んでみました。パッと見はPlaywrightのラッパーに見えるのですが、実際にはAIエージェント向けの入出力設計がかなり練られていて、面白かったです。 従来のPlaywright MCPが抱える課題まず、なぜ新しいツールが必要だったのかを整理しておきます。 Playwright MCPは、ブラウザ自動化のデファクトスタンダードであるPlaywrightをMCPサーバーとして提供したものです。多機能なのですが、AIエージェントから使う場合にはいくつかの問題がありました。 ひとつはツールの数です。Playwri

    agent-browserに学ぶAI最適なブラウザ操作とツール提供の考え方|Seiji Takahashi@ベースマキナ
    mkusaka
    mkusaka 2026/01/15
    agent-browserの設計を技術的に解析し、アクセシビリティツリーとSnapshot + Refsや-iフラグでトークン消費を93%削減した手法を解説。
  • 発表から約2週間、いますぐ使えるAgent Skills 10選|Seiji Takahashi@ベースマキナ

    皆さまこんにちは、株式会社ベースマキナの代表取締役社長を務めております高橋(@__timakin__)です。 2025年12月18日、AnthropicがAgent Skillsをオープンスタンダードとして発表しました。MCPに続く標準化の動きとして注目を集めています。 面白いのは、発表からわずか数日でOpenAIがCodex CLIとChatGPTに同規格を採用し、GitHub Copilotも対応を発表したこと。Anthropicが仕様を公開し、競合が追従する——MCPで見た流れが再び起きています。さすがAnthropicという感じで、一気に業界標準となりつつありますね。 この記事では、発表から約2週間で話題になっているスキルを厳選して紹介します。 この記事でわかることAgent Skillsの概要 カテゴリ別おすすめスキル10選 インストール方法と注意点 Agent Skillsとは

    発表から約2週間、いますぐ使えるAgent Skills 10選|Seiji Takahashi@ベースマキナ
    mkusaka
    mkusaka 2025/12/28
    Anthropicが公開したAgent Skillsの中から、docx・xlsx・pptx・pdfなどの文書処理やPlaywright自動化など、すぐ使える10選とインストール手順を紹介
  • AI活用の標準化とキャズム、そしてFDE 〜2025年のベースマキナと技術トレンド〜|Seiji Takahashi@ベースマキナ

    機能リリースと提供価値の変化細かい改善は頻繁に行っていますが、大きな機能リリースも多々ございました。 開発体験の観点は特に大きく、設定のバージョン管理により普通のソフトウェア開発と同様に安心してデリバリーできるように。 また、「ビジュアルエディター」というノーコード機能により、ソフトウェアエンジニアの方々でも画面を編集できるようになりました。 アクション(SQL実行やAPI呼び出し)を環境ごとにバージョン管理・有効化できる機能 ノーコードの画面作成機能、ビジュアルエディター ベースマキナは汎用基盤なので、AIプラットフォームのAPIとつなぎこんで知的作業を自動化できます。 また、ドキュメントのllms-full.txtを公開しているので、コーディングエージェントやNotebookLMでドキュメントを参照して頂き、よりロータッチ化が進みました。 「AI活用ユースケース」の公開 Noteboo

    AI活用の標準化とキャズム、そしてFDE 〜2025年のベースマキナと技術トレンド〜|Seiji Takahashi@ベースマキナ
    mkusaka
    mkusaka 2025/12/26
    BaseMachinaが提供するAI CSV STUDIOやビジュアルエディタで、2025年の技術トレンドとAI活用標準化を解説
  • なぜ、AI活用予算執行を機動的に行うべきか?|Seiji Takahashi@ベースマキナ

    こんにちは! 社内管理画面を安全かつ簡単に作れるSaaSを提供しているベースマキナという会社の代表をしています、高橋(@__timakin__)と申します。 最近もご利用頂く事業者様が増えており、大変ありがたい限りでございます。 皆さまの会社ではコーディングエージェント等、活用していらっしゃいますか?弊社はしています(私はほどほどに、エンジニアメンバーはがっつり)。 最近よくAIエージェント開発や開発支援AIの感想会の勉強会にお邪魔するのですが、その際に周りの事業者様と活用状況についてお話する機会が増えました。 「うちはまだ導入したてで、活用までは至っていない」という方や、これから導入していく方も多い状況かと思います。 弊社内では積極的にツール導入を機動的に導入するにあたり、いくつか取っているスタンスがあるのでそれをメモがてら書いてみました。 ベースマキナでのAI活用状況2025年6月上旬

    なぜ、AI活用予算執行を機動的に行うべきか?|Seiji Takahashi@ベースマキナ
    mkusaka
    mkusaka 2025/06/10
    AI活用予算を機動的に執行すべき理由を解説、BaseMachinaは数分で安全な管理画面を構築できるローコードSaaSを提供
  • さよならアーキテクチャ議論|Seiji Takahashi@ベースマキナ

    ポエム。 つまり?予算やチームのリテラシーに合わせて最速で作れて、チーム内で「俺ら高凝集低結合だなー」と思えるなら、アーキテクチャはなんでもいいと思えてきました。 前提・まだ割と収益が安定してないプロジェクトでの話です。お金があるなら好きにやりましょう。Go Bold。 ・DDDやクリーンアーキテクチャがダメとは言ってないです。むしろ自分は直近そこまで厳格ではないクリーンアーキテクチャでAPI書いてます。 ・以前こういうポスト書くくらいにはアーキテクチャのこと試行錯誤してました。 アーキテクチャ導入議論への疲労以前僕は、DDDやクリーンアーキテクチャを導入するという話が出ると積極的に顔を出すようにしていました。でも、最近は「導入しましょう」「既に適用してあるのでキャッチアップしてください」などの議論をするのに少し疲れてしまい、足が重くなったように感じます。もうおじいちゃんなので体力がないん

    さよならアーキテクチャ議論|Seiji Takahashi@ベースマキナ
    mkusaka
    mkusaka 2020/06/29
  • CircleCI Orbs開発完全ガイド 2019年度版|Seiji Takahashi@ベースマキナ

    前置きCircleCI Orbsというのは、CircleCIのバージョン2.1以降で有効になった、CI/CDワークフローの一部を共通パッケージとして切り出す仕組みです。 CircleCIはバージョン2.0のメジャーアップデートを経て、一気に実行速度が上がりました。しかし、プロセスの共通化をするにはyamlの記述方法を工夫する以外は特に打ち手がありませんでした。 Orbはまさにその解決策として提示された、CIプロセスのパッケージ化です。 なお、バージョン2.1になったことで、いくつか追加の概念が登場しました。 executors, commands, jobsです。この辺は公式ドキュメントを見ていただくとして、ざっくり言うとexecutorsが実行環境、commands, jobsが実行プロセスの共通化です。 OrbはDockerのイメージと同じく、作ったものをインターネット上で公開するレジ

    CircleCI Orbs開発完全ガイド 2019年度版|Seiji Takahashi@ベースマキナ
    mkusaka
    mkusaka 2019/12/31
  • 1