AIソフトウェアエンジニア「Devin」の導入を通じてS-Mat, Inc.がAIファーストな開発組織への移行を模索した経緯を紹介します。 https://confengine.com/conferences/devopsdays-tokyo-2025/schedule/rich#session-…

はじめに 便利なのになんとなく使ってる人少ないなあと思ってたので、記事にしてみました。 いろんなLLMを統合できるというメリットもありますが、普通に高性能モデルを無料で使えるので、それだけでも使い倒す価値はあると思います。 OpenRouterとは OpenRouterでは、市場の主要はLLMモデルにアクセスできる統合APIを提供しており、あらゆるモデルの処理と統一的に書くことができます。(後述します) 統一的にかけるので、LLMプロバイダごとにコードを変える必要がなく、一度作成したコードを以降出現するあらゆるモデルに流用できるのが嬉しいです。 まあ、私的には基本的にLangChainを利用するので、この恩恵はあまり受けていませんが。 もう一つの恩恵は、優秀なAPIモデルや、ローカルLLMのモデルが無料モデルとして提供されていることです。 中には非常に優秀なモデルも無料で使えるので、料金を
はじめに こんにちは!LayerX AI・LLM事業部LLMグループのマネージャーを務めていますエンジニアの恩田( さいぺ )です。 AI・LLM事業部では「Ai Workforce」というプロダクトを開発しています。レポジトリができてから早1年半、多数の機能が実装されてきました。ところが昔から存在する一部の機能については、開発者が不在、仕様や実装を完全に把握しているメンバーが特定のエンジニアに限られているといった課題が発生しています。 また、開発スピードを優先し、コメントが残されていないコードや、設計ドキュメントがないといった課題もありました。 こうした課題に対して、Devinを活用して .cursorrules を生成し、非エンジニアメンバーの力も借りながら、ドキュメント化を進めた取り組みについて紹介したいと思います。 AIによるドキュメント作成フロー まず、Devinにレポジトリのコ
「型システムの仕組み - TypeScriptで実装しながら学ぶ型とプログラミング言語」という本を書きました。 「型システムの仕組み - TypeScriptで実装しながら学ぶ型とプログラミング言語」 どんな本? 簡単な型チェッカを自作してみることで、型システムの仕組みを概観する本です。 型チェックする対象の言語はTypeScript(のサブセット言語)、型チェッカを実装するための言語もTypeScriptです。 たとえば、次のようなプログラムが型チェックできるようになります。 const add = (x: number, y: number) => { return x + y; } const a = add(1, 2); const b = a + true; 型チェッカは、それぞれの変数がどういう型を持つか管理しつつ、プログラムの各パートがどういう型になるかを判定していきます。
1. はじめに 2. 制約 3. トライアル成果 発見1. 技術負債の特定とリファクタリング実装の半自動化 発見2. イベントストーミングで設計した画像をもとにドメインモデルと制約の実装 発見3. 指示範囲を明確に絞れば、人より格段に早い 発見4. 開発者の学習効率を上げる Devin or Cline? 4. 25年3月時点での課題 5. 投資対効果と組織スケールの変化 AIツールの投資対効果 AIツールによって変化した組織スケールの方法 今後の展望 1. はじめに こんにちは。DMM.comでプラットフォーム開発本部の副本部長をしている石垣です。 今回は当社で実施したAIエージェント「Devin」と「Cline」の導入検証の結果について共有したいと思います。 DMMグループのクリエイター組織は、現在1,200名近くのメンバーを抱え、エンジニアだけでも1,000名近くのメンバーがいる組織
バクラク事業部エンジニアの id:upamune です。最近、ローカル開発環境構築に対して人より熱意があるということに気がつきました。 ということで、この記事ではバクラク事業部での、ローカル開発環境構築の今について書きます。 はじめに 近頃、AIの発展により開発、特にコーディングのハードルは大きく下がりました。弊社でもプロダクトマネージャーやデザイナーがエンジニアに混じってPRを出しています。 詳しくはバクラクビジネスカードでプロダクトマネージャーをしている原山がnoteを書いているのでご覧ください。 note.com しかし、ここで開発の障壁となるのが最初のローカル開発環境の構築です。セットアップドキュメントは存在しますが、主にソフトウェアエンジニア向けに書かれており、ローカルでアプリケーションを動かすだけなら不要なツールまでまとめてインストールするため、時間のかかるものになっていました
協働的AIチームメイトを謳うソフトウェア開発エージェント、Devin が注目を集めています。日本コミュニティでの勉強会は参加者が1000人を超えるほどです(!) 今回はDevin的な動きを実現するセルフホスト型のソリューションを開発してみたので、その紹介です。 TL;DR; こちら↓にソースコード (IaC + Agent + Bolt app) を公開しています。 github.com 主な機能は以下です: クラウド上で並列して動作できるソフトウェア開発エージェント サーバーレス構成のため、料金の前払いは不要で固定費もほぼゼロ MCPサーバーとの統合が可能 プロンプトキャッシュやコンテキスト長制御によるコスト効率化 OSSのレポジトリもフォークして開発可能 .clinerules や CLAUDE.md などからリポジトリ固有の知識を自動読み込み AWSアカウントとGitHubアカウント
LangManusとは LangManusはLangGraphを利用したManusの再現実装です。 そもそもManusは中国のAIスタートアップが発表した完全自律型のAIエージェントです。 通常の対話型のチャットボットAIではなく、ユーザの指示に基づいて、自発的に問題解決の方法を検討し、自律的にタスクを実行できます。 みじかな例では、Open AIのDeep Researchに近いです。 LangManusは、その自律型のAIエージェントをLangGraphを利用して再現しようというオープンソースの試みです。 試した感じでは、流石にまだまだ性能はDeep Researchなどには及んでいませんが、面白い試みだと思います。 よりシンプルなAIエージェント実装する 今回はLangManusのように、LangGraphを用いて自律型のAIエージェントを構築する方法を学ぶために、LangManus
言語モデルの物理学 (Physics of Language Models) とは、FAIR (Meta) の Zeyuan Allen-Zhu が提唱した、言語モデルの研究を進めるためのコンセプトです。ざっくり言うと、「あのモデルはこう」とか「そのモデルはこのモデルよりもこう」というような博物学的な知識を深めるのではなく、17世紀にケプラーやニュートンが物理学において行ったような原理に基づいた研究を進め、「言語モデルはなぜこのような振る舞いをするのか」という問いに答えられるようになるべきという考え方です。 言語モデルの物理学の特徴は大きく2つあります。 第一は、ウェブから収集したコーパスを使わず、きっちりコントロールされたデータセットを使って言語モデルを訓練するということ。ウェブは誰も全体像を理解できないほど複雑で、ノイズにまみれています。本物の物理学でも空気抵抗や摩擦があると、「鉄球は
こんにちは、株式会社エスマットでエンジニアリングマネージャーを担当している仙葉です 弊社ではマイクロサービスアーキテクチャを採用しており、システムの柔軟性を高める一方で、横断的な修正が必要になった際に作業量が増大するという課題があります 今回はDevinを利用し、各マイクロサービスに対して効率的に作業を行うための活用方法と、将来的な自動化への展望についてご紹介します 取り組んだタスクの概要 作業内容 DB管理用MSに集められているテーブル定義にカラム、テーブルコメントを追加する 各マイクロサービスの実装やドキュメントを参照し、コメント内容を決定する そのテーブル独自でID以外のにはサンプルデータも記載してもらう 期待する成果物 テーブルスキーマ修正 反映用のAlterTableクエリ作成 このタスクは技術的には難易度が低いものの、複数マイクロサービスを参照し、同様の作業を横展開する必要があ
こんにちは、しば田です。 AIの登場でエンジニアに求められるマインドセットにも変化が生まれてきています。 AIにどっぷり触れている人は行動の変化に引っ張られるカタチでマインドセットも形成されてきているとは思うのですが、まとまって言語化されているものは現状なさそうなので、自分の思考整理を兼ねて言語化してみようと思います。 「システムエンジニア」に必要なマインドセットと銘打ちましたが、 AIを用いて開発する全人類が対象読者になります。これまでの開発経験も別に問わない内容です。 では、早速本題にいきます。 1. AIへの期待値を正しく持つ AIに限った話ではないですが、正しい期待値を持たないとその期待が裏切られた時に多大なストレスがかかります。 これまでAIをトライしてみたけどすぐに使わなくなった人が自分の周りにもいましたが、大体は期待値の調整ができていない人だったと思います。自分が観測している
はじめに 10X ソフトウェアエンジニアの野々村です。元々アプリケーション開発者としてサーバーサイドを中心に仕事をしてきましたが、最近は協業する小売事業者様から受領したデータをネットスーパーに掲載できる状態へ加工する商品データパイプラインの開発に主に携わっています。 10x.co.jp 10XでもDevin AIを利用し始めて1ヶ月程度が経ったので、適用事例と展望について紹介します。 前提 Devin AI とは Cognition AI社によって提供されるAIエージェントSaaSです。2024年12月に一般利用が開始され、各所で導入事例が紹介されています。 devin.ai Devin AIの特性として、以下のようなタスクが得意とされています。 実装の検証が容易である 参考実装にアクセス可能である Devin AIと適用領域の特性のマッチング 10Xでは私が開発に携わる商品データパイプラ
エスマットでエンジニアをしているpotix2です。最近、 社内の EKS クラスター上に Dify 環境を構築していたときに設定ミスから予想外の問題に遭遇しました。この問題解決に Cline を活用したところ、コードリーディングの効率が大幅に向上し、従来の方法よりも短時間で原因特定ができました。 この記事では、SRE のための Cline 活用法と、実際のトラブルシューティング事例について共有します。 1 分まとめ Cline に実行ログを与えると、関連するコードを素早く特定できる Dify 環境の構築時、複数コンポーネント間のキャッシュ問題を Cline で効率的に解決した SRE こそ Cline を活用すべき、コードリーディングの効率が大幅に向上する Dify でのトラブル:見えない依存関係の謎 Dify は、ノーコード・ローコードで AI アプリケーションを開発できるオープンソース
こんにちは。エスマットエンジニアの金尾です。 皆さんはDevinと働いていてつらい思いをしたことはありますか? 僕はあります。 弊社にDevinがやってきてからしばらく経ちました。チュートリアルとも言われる250ACUは早々に使い切り、今ではプロダクト改善タスクをこなしながらいろいろと運用方法を模索している段階です。 支払い上限分まで働くとその後は一切の活動を停止するDevin。 いち労働者として見習いたい。 本記事では、Devinを使ってみた所感および今後の活用についてまとめたものです。 AIエージェントとしての特徴 以下、二ヶ月ほど使ってみての所感です。 (他と比較すると)遅い Cursorなどの他のAIエージェントと比較すると、Devinの作業スピードは決して速いものではありません。Sessionチャットからその場で都度指示出しすることはできますが、体験としてはあまりよくなく、併走し
発表・掲載日:2025/03/10 日本語音声基盤モデル「いざなみ」「くしなだ」を公開 -少量の日本語音声データで高性能な音声AIを構築可能に- ポイント 豊かな感情表現を含む6万時間の日本語音声データから2種類の日本語音声基盤モデルを構築 モデルの改良が容易な「いざなみ」と感情認識や音声認識の能力がより高い「くしなだ」を一般公開 少量データを活用した音声AIの構築・普及に貢献 国立研究開発法人 産業技術総合研究所(以下「産総研」という)人工知能研究センター 深山覚 研究チーム長、緒方淳 客員研究員は、高性能な音声AI構築に利用可能な2種類の日本語音声基盤モデル「いざなみ」「くしなだ」を公開しました。 音声基盤モデルとは、音声データを処理・解析するための汎用的なAIモデルで、音声認識や音声感情認識などに応用が進んでいます。音声基盤モデルの構築には、対象とする言語やそれが使われるシーンを想定
概要 LLM as a Judgeとは? なぜLLM as a Judgeが注目されているのか? LLM as a Judgeのプロセス プロンプト設計の詳細 モデル選択の詳細 後処理の詳細 LLM as a Judgeの適用シナリオ 評価パフォーマンス改善戦略 LLM評価者の評価 課題と今後の展望 結論 余談 概要 2025年1月10日に行われたキャディ機械学習勉強会でのLLM as a Judgeに関するレビュー論文の紹介と議論を踏まえ、本記事はA Survey on LLM-as-a-Judge を読み、内容をまとめ、LLMを評価者として用いる概念、そのプロセス、利点、課題、将来展望について解説したものです。 LLM as a Judgeとは? 従来、専門家が担当していた評価業務をLLMに代行させるという試みです。これにより、評価プロセスの効率化、コスト削減、一貫性の向上が期待されて
こんにちは、ジェネラティブエージェンツの西見です。 「完全自律型AIエンジニア」という触れ込みと、その印象的なティザー動画で一躍有名になったDevinが、2024年12月10日にGAしました。 www.cognition.ai それからしばらく経ったこともあって、X上でもチラホラと日本企業におけるDevin採用報告が聞こえてくるようになり、「こんなタスクには使えた😆」「簡単なタスクにハマり続けて使えない、金もったいない😭」といったポストがよく見られるようになりました。 正直なところ、月500ドルは高いなぁ・・・*1なんて思っていたのですが、弊社も多分に漏れず猫の手も借りたい状況なのもあって、2025年1月22日からDevin(猫の手)を採用してみました。それからちょうど1ヶ月が経ったので、弊社の開発状況にどんな変化があったのかを振り返って、レポートしてみたいと思います。 GitHubア
世はまさに大AI時代。あらゆる業務領域でAIが活用され、そのスピード感についていくのが大変な時代になってきました。 当然、スライド作成もAIで自動化できるはず! ということで、弊社でも営業やCSチームがより簡単にスライドを作れるようにと、「Gamma(ガンマ)」を導入してみました。 しかし、実際に試してみると、社内からチラホラ「うまく使えないかも」(※小声)という声が・・・ 他に良いサービスはないのか?どうしたら使えるようになるか?を、デザイナーの私が色々触って確かめてみました。 実際に5つのAIスライドツールを試してみた今回は、弊社の「月締会」(つきしめかい)のスライドを作るという条件で、5つのツールを比較しました。 🔹 プロンプト以下のようなイベントスライドを作成できるかテストしました。 月末に行う「月締会」というイベントのスライドを作りたい。 #構成 1. 表紙 2. 会の目的 3
こんにちは、Insight EdgeでDeveloper兼テックブログ運営担当をしているMatsuzakiです。 今回は、私が担当している本テックブログ「Insight Edge Tech Blog」運営担当業務における業務効率化・高度化兼自己研鑽の一貫として現在テックブログレビューエージェントを試作中ですので、そちらの開発経緯や内容をお話ししていきたいと思います。 目次 開発背景 システム構成 レビューの流れ 開発内容 レビュー観点の洗い出し 処理フロー 実装 ステートの定義 グラフの定義 ノードの追加 エントリーポイントの追加 エッジの追加 コンパイルと実行 成果物について 今後の期待 おわりに 開発背景 本テックブログ「Insight Edge Tech Blog」は、2022年10月に開設し、2025年2月現在で2年以上継続しています。(先日記事も100本を超えました!🎉) しか
エスマットでエンジニアをしているpotix2です。先日、エンジニアリングチームで生成AIアプリケーション開発のハッカソンを開催しました。8名のエンジニアが5チームに分かれ、1日という短期間で様々なプロジェクトに取り組みました。本記事では、その成果と学びを共有します。 ハッカソンの様子 なぜハッカソンを実施したのか 全社的な方針として、業務とプロダクトの両面で生成AIをフル活用していく方向性が示されました。これを受けて、エンジニアリングチームでは生成AIアプリケーション開発に必要な技術的スキルを効率的に習得する必要性に迫られていました。 私たちは既存業務の延長線上ではなく、新規プロジェクトとして技術習得に取り組むことが効果的だと考え、ハッカソン形式での実施を決めました。短期間で集中的に開発することで、生成AIアプリケーション開発の全体像を把握し、必要な技術スタックへの理解を深めることを目指し
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く