タグ

kanda_kのブックマーク (266)

  • 完全自律型AIエージェントOSS【LangManus】完全に理解した!

    LangManusとは LangManusはLangGraphを利用したManusの再現実装です。 そもそもManusは中国AIスタートアップが発表した完全自律型のAIエージェントです。 通常の対話型のチャットボットAIではなく、ユーザの指示に基づいて、自発的に問題解決の方法を検討し、自律的にタスクを実行できます。 みじかな例では、Open AIのDeep Researchに近いです。 LangManusは、その自律型のAIエージェントをLangGraphを利用して再現しようというオープンソースの試みです。 試した感じでは、流石にまだまだ性能はDeep Researchなどには及んでいませんが、面白い試みだと思います。 よりシンプルなAIエージェント実装する 今回はLangManusのように、LangGraphを用いて自律型のAIエージェントを構築する方法を学ぶために、LangManus

    完全自律型AIエージェントOSS【LangManus】完全に理解した!
  • 言語モデルの物理学 - ジョイジョイジョイ

    言語モデルの物理学 (Physics of Language Models) とは、FAIR (Meta) の Zeyuan Allen-Zhu が提唱した、言語モデルの研究を進めるためのコンセプトです。ざっくり言うと、「あのモデルはこう」とか「そのモデルはこのモデルよりもこう」というような博物学的な知識を深めるのではなく、17世紀にケプラーやニュートンが物理学において行ったような原理に基づいた研究を進め、「言語モデルはなぜこのような振る舞いをするのか」という問いに答えられるようになるべきという考え方です。 言語モデルの物理学の特徴は大きく2つあります。 第一は、ウェブから収集したコーパスを使わず、きっちりコントロールされたデータセットを使って言語モデルを訓練するということ。ウェブは誰も全体像を理解できないほど複雑で、ノイズにまみれています。物の物理学でも空気抵抗や摩擦があると、「鉄球は

    言語モデルの物理学 - ジョイジョイジョイ
    kanda_k
    kanda_k 2025/03/25
  • Devinと仕組み化で繰り返しタスクの作業効率化

    こんにちは、株式会社エスマットでエンジニアリングマネージャーを担当している仙葉です 弊社ではマイクロサービスアーキテクチャを採用しており、システムの柔軟性を高める一方で、横断的な修正が必要になった際に作業量が増大するという課題があります 今回はDevinを利用し、各マイクロサービスに対して効率的に作業を行うための活用方法と、将来的な自動化への展望についてご紹介します 取り組んだタスクの概要 作業内容 DB管理用MSに集められているテーブル定義にカラム、テーブルコメントを追加する 各マイクロサービスの実装やドキュメントを参照し、コメント内容を決定する そのテーブル独自でID以外のにはサンプルデータも記載してもらう 期待する成果物 テーブルスキーマ修正 反映用のAlterTableクエリ作成 このタスクは技術的には難易度が低いものの、複数マイクロサービスを参照し、同様の作業を横展開する必要があ

    Devinと仕組み化で繰り返しタスクの作業効率化
  • AI時代を生きるエンジニアに必要なマインドセット

    こんにちは、しば田です。 AIの登場でエンジニアに求められるマインドセットにも変化が生まれてきています。 AIにどっぷり触れている人は行動の変化に引っ張られるカタチでマインドセットも形成されてきているとは思うのですが、まとまって言語化されているものは現状なさそうなので、自分の思考整理を兼ねて言語化してみようと思います。 「システムエンジニア」に必要なマインドセットと銘打ちましたが、 AIを用いて開発する全人類が対象読者になります。これまでの開発経験も別に問わない内容です。 では、早速題にいきます。 1. AIへの期待値を正しく持つ AIに限った話ではないですが、正しい期待値を持たないとその期待が裏切られた時に多大なストレスがかかります。 これまでAIをトライしてみたけどすぐに使わなくなった人が自分の周りにもいましたが、大体は期待値の調整ができていない人だったと思います。自分が観測している

    AI時代を生きるエンジニアに必要なマインドセット
  • Devin AIの商品データパイプラインへの適用 - 10X Product Blog

    はじめに 10X ソフトウェアエンジニアの野々村です。元々アプリケーション開発者としてサーバーサイドを中心に仕事をしてきましたが、最近は協業する小売事業者様から受領したデータをネットスーパーに掲載できる状態へ加工する商品データパイプラインの開発に主に携わっています。 10x.co.jp 10XでもDevin AIを利用し始めて1ヶ月程度が経ったので、適用事例と展望について紹介します。 前提 Devin AI とは Cognition AI社によって提供されるAIエージェントSaaSです。2024年12月に一般利用が開始され、各所で導入事例が紹介されています。 devin.ai Devin AIの特性として、以下のようなタスクが得意とされています。 実装の検証が容易である 参考実装にアクセス可能である Devin AIと適用領域の特性のマッチング 10Xでは私が開発に携わる商品データパイプラ

    Devin AIの商品データパイプラインへの適用 - 10X Product Blog
    kanda_k
    kanda_k 2025/03/24
  • SREのためのCline活用法:OSSコードリーディングを効率化する実践テクニック

    エスマットでエンジニアをしているpotix2です。最近、 社内の EKS クラスター上に Dify 環境を構築していたときに設定ミスから予想外の問題に遭遇しました。この問題解決に Cline を活用したところ、コードリーディングの効率が大幅に向上し、従来の方法よりも短時間で原因特定ができました。 この記事では、SRE のための Cline 活用法と、実際のトラブルシューティング事例について共有します。 1 分まとめ Cline に実行ログを与えると、関連するコードを素早く特定できる Dify 環境の構築時、複数コンポーネント間のキャッシュ問題を Cline で効率的に解決した SRE こそ Cline を活用すべき、コードリーディングの効率が大幅に向上する Dify でのトラブル:見えない依存関係の謎 Dify は、ノーコード・ローコードで AI アプリケーションを開発できるオープンソース

    SREのためのCline活用法:OSSコードリーディングを効率化する実践テクニック
  • Devinとの日々を振り返る

    こんにちは。エスマットエンジニアの金尾です。 皆さんはDevinと働いていてつらい思いをしたことはありますか? 僕はあります。 弊社にDevinがやってきてからしばらく経ちました。チュートリアルとも言われる250ACUは早々に使い切り、今ではプロダクト改善タスクをこなしながらいろいろと運用方法を模索している段階です。 支払い上限分まで働くとその後は一切の活動を停止するDevin。 いち労働者として見習いたい。 記事では、Devinを使ってみた所感および今後の活用についてまとめたものです。 AIエージェントとしての特徴 以下、二ヶ月ほど使ってみての所感です。 (他と比較すると)遅い Cursorなどの他のAIエージェントと比較すると、Devinの作業スピードは決して速いものではありません。Sessionチャットからその場で都度指示出しすることはできますが、体験としてはあまりよくなく、併走し

    Devinとの日々を振り返る
  • 産総研:日本語音声基盤モデル「いざなみ」「くしなだ」を公開

    発表・掲載日:2025/03/10 日語音声基盤モデル「いざなみ」「くしなだ」を公開 -少量の日語音声データで高性能な音声AIを構築可能に- ポイント 豊かな感情表現を含む6万時間の日語音声データから2種類の日語音声基盤モデルを構築 モデルの改良が容易な「いざなみ」と感情認識や音声認識の能力がより高い「くしなだ」を一般公開 少量データを活用した音声AIの構築・普及に貢献 国立研究開発法人 産業技術総合研究所(以下「産総研」という)人工知能研究センター 深山覚 研究チーム長、緒方淳 客員研究員は、高性能な音声AI構築に利用可能な2種類の日語音声基盤モデル「いざなみ」「くしなだ」を公開しました。 音声基盤モデルとは、音声データを処理・解析するための汎用的なAIモデルで、音声認識や音声感情認識などに応用が進んでいます。音声基盤モデルの構築には、対象とする言語やそれが使われるシーンを想定

  • キャディ 機械学習勉強会: LLM as a Judgeのレビュー論文について - CADDi Tech Blog

    概要 LLM as a Judgeとは? なぜLLM as a Judgeが注目されているのか? LLM as a Judgeのプロセス プロンプト設計の詳細 モデル選択の詳細 後処理の詳細 LLM as a Judgeの適用シナリオ 評価パフォーマンス改善戦略 LLM評価者の評価 課題と今後の展望 結論 余談 概要 2025年1月10日に行われたキャディ機械学習勉強会でのLLM as a Judgeに関するレビュー論文の紹介と議論を踏まえ、記事はA Survey on LLM-as-a-Judge を読み、内容をまとめ、LLMを評価者として用いる概念、そのプロセス、利点、課題、将来展望について解説したものです。 LLM as a Judgeとは? 従来、専門家が担当していた評価業務をLLMに代行させるという試みです。これにより、評価プロセスの効率化、コスト削減、一貫性の向上が期待されて

    キャディ 機械学習勉強会: LLM as a Judgeのレビュー論文について - CADDi Tech Blog
  • Devinを導入して1ヶ月経ったので、人間とAIとでどのような開発の役割分担をするべきか振り返ってみる - Generative Agents Tech Blog

    こんにちは、ジェネラティブエージェンツの西見です。 「完全自律型AIエンジニア」という触れ込みと、その印象的なティザー動画で一躍有名になったDevinが、2024年12月10日にGAしました。 www.cognition.ai それからしばらく経ったこともあって、X上でもチラホラと日企業におけるDevin採用報告が聞こえてくるようになり、「こんなタスクには使えた😆」「簡単なタスクにハマり続けて使えない、金もったいない😭」といったポストがよく見られるようになりました。 正直なところ、月500ドルは高いなぁ・・・*1なんて思っていたのですが、弊社も多分に漏れずの手も借りたい状況なのもあって、2025年1月22日からDevin(の手)を採用してみました。それからちょうど1ヶ月が経ったので、弊社の開発状況にどんな変化があったのかを振り返って、レポートしてみたいと思います。 GitHub

    Devinを導入して1ヶ月経ったので、人間とAIとでどのような開発の役割分担をするべきか振り返ってみる - Generative Agents Tech Blog
  • 「AIスライド作成ツール」をうまく使うコツとは? 現役デザイナーが考えてみた!|にーの

    世はまさに大AI時代。あらゆる業務領域でAIが活用され、そのスピード感についていくのが大変な時代になってきました。 当然、スライド作成もAIで自動化できるはず! ということで、弊社でも営業やCSチームがより簡単にスライドを作れるようにと、「Gamma(ガンマ)」を導入してみました。 しかし、実際に試してみると、社内からチラホラ「うまく使えないかも」(※小声)という声が・・・ 他に良いサービスはないのか?どうしたら使えるようになるか?を、デザイナーの私が色々触って確かめてみました。 実際に5つのAIスライドツールを試してみた今回は、弊社の「月締会」(つきしめかい)のスライドを作るという条件で、5つのツールを比較しました。 🔹 プロンプト以下のようなイベントスライドを作成できるかテストしました。 月末に行う「月締会」というイベントのスライドを作りたい。 #構成 1. 表紙 2. 会の目的 3

    「AIスライド作成ツール」をうまく使うコツとは? 現役デザイナーが考えてみた!|にーの
  • LangGraphを使ってテックブログレビューエージェントを作ってみた - Insight Edge Tech Blog

    こんにちは、Insight EdgeでDeveloper兼テックブログ運営担当をしているMatsuzakiです。 今回は、私が担当しているテックブログ「Insight Edge Tech Blog」運営担当業務における業務効率化・高度化兼自己研鑽の一貫として現在テックブログレビューエージェントを試作中ですので、そちらの開発経緯や内容をお話ししていきたいと思います。 目次 開発背景 システム構成 レビューの流れ 開発内容 レビュー観点の洗い出し 処理フロー 実装 ステートの定義 グラフの定義 ノードの追加 エントリーポイントの追加 エッジの追加 コンパイルと実行 成果物について 今後の期待 おわりに 開発背景 テックブログ「Insight Edge Tech Blog」は、2022年10月に開設し、2025年2月現在で2年以上継続しています。(先日記事も100を超えました!🎉) しか

    LangGraphを使ってテックブログレビューエージェントを作ってみた - Insight Edge Tech Blog
  • エンジニアチームの生成AIアプリ開発、ハッカソンから始めた理由

    エスマットでエンジニアをしているpotix2です。先日、エンジニアリングチームで生成AIアプリケーション開発のハッカソンを開催しました。8名のエンジニアが5チームに分かれ、1日という短期間で様々なプロジェクトに取り組みました。記事では、その成果と学びを共有します。 ハッカソンの様子 なぜハッカソンを実施したのか 全社的な方針として、業務とプロダクトの両面で生成AIをフル活用していく方向性が示されました。これを受けて、エンジニアリングチームでは生成AIアプリケーション開発に必要な技術的スキルを効率的に習得する必要性に迫られていました。 私たちは既存業務の延長線上ではなく、新規プロジェクトとして技術習得に取り組むことが効果的だと考え、ハッカソン形式での実施を決めました。短期間で集中的に開発することで、生成AIアプリケーション開発の全体像を把握し、必要な技術スタックへの理解を深めることを目指し

    エンジニアチームの生成AIアプリ開発、ハッカソンから始めた理由
  • 開発速度よりも大事なものを見つけた話 - Algomatic Tech Blog

    こんにちは、シゴラクAIカンパニーCTOの菊池 (@_pochi) です。 この記事は、Algomatic アドベントカレンダー2024の15日目の記事です。 algomatic.jp シゴラクAIカンパニーでは、「シゴラクAI」という法人向け生成AI活用プラットフォームの開発運用に加えて、新たな事業領域でのチャレンジを進めています。 新規事業立ち上げという、最大限に不確実性が大きい事業フェーズ において、エンジニアリングによって事業価値向上に最大限寄与するにはどうしたらいいか?を試行錯誤してきました。 記事では、そんな試行錯誤の過程である、現在のシゴラクAIカンパニーの開発スタイルについてご紹介できればと思っております。 「開発速度」より「変化への即応性」を重視しています 開発速度は非常に大事ですよね。ソフトウェアによって課題を解決する事業運営において、ソフトウェアエンジニアの開発速度

    開発速度よりも大事なものを見つけた話 - Algomatic Tech Blog
    kanda_k
    kanda_k 2025/01/30
  • RAGが「複雑な質問に弱い問題」を解決する「Plan×RAG」

    記事では、RAGの性能を高めるための「Plan×RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何 この記事は、RAGの文脈消える問題を克服する新手法「Plan×RAG」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。 題 ざっくりサマリー Plan×RAGは、RAGの精度を上げるための新しい手法です。アールト大学とMicrosoft Researchの研究者らによって2024年10月に提案されました。 ざっくり言うと、Plan×RAGとは、「計画を立ててから検索する」手法です。Plan×RAGでは、ユーザーの質問を、まず最初に小さな単位に分解。その後、それらの関係性

    RAGが「複雑な質問に弱い問題」を解決する「Plan×RAG」
    kanda_k
    kanda_k 2025/01/29
  • Google DriveとLLMで議事録を自動生成する仕組みを作る

    Google DriveとLLMで議事録を自動生成する仕組みを作る こんにちは。 株式会社エスマットでSREをしているbiosugar0です。 今回は私が社内向けに構築した Google Driveにアップロードされた音声・動画ファイルからLLMを使って自動的に議事録を生成するシステムを紹介します。Python製です。 数ある会議や電話、インタビュー音源を文字起こしし、要点をまとめる作業は非常に手間がかかりがちです。そこで、Google Cloud Run・Google WorkflowWhisper・gpt-4o などを活用して、書き起こしから最終的な議事録ドキュメントを作成するまでを自動化しました。Googleカレンダー情報の連携やSRT形式による動画連携、フォルダ名による処理分岐など、拡張性を持った仕組みを整えているので、そのポイントを順番に紹介していきます。 システム全体概要 全

    Google DriveとLLMで議事録を自動生成する仕組みを作る
    kanda_k
    kanda_k 2025/01/23
  • クッキーとセッションを雰囲気で使っているエンジニアが、違いを説明できるようになる記事

    どうもお疲れ様です。MESIです。 Web系のエンジニアをやっていると普段からクッキーやらセッションやらを使うことになると思います。 皆さんの職場でも、こんな言葉を耳にするのではないでしょうか。 「クッキーに保存しよう」 「クッキー削除しよう」 「セッションに保存しよう」 「セッションが切れた」 そこで私のようなよわよわエンジニアはこう思うのです。 「クッキーとセッションの違い is 何?」 今回はそんな私のようなエンジニア向きにクッキーとセッションを説明していきます。 そもそもなぜクッキーやらセッションが必要なのか そもそもなぜクッキーやセッションは必要なのでしょうか。 それはHTTPはステートレスなプロトコルだからです。 ステートレスって? ステートレスは、その名の通り「状態を保持しない」ことを指します。 HTTPはサーバーがクライアントの状態を覚えず、毎回新たなリクエストとして処理さ

    クッキーとセッションを雰囲気で使っているエンジニアが、違いを説明できるようになる記事
  • 米国でスタートアップの要職をやってたけどレイオフされてしまった話|井上恭輔(きょろ)

    気づけばもう半年以上前の話になりますが、2024年5月、Interim CTOやSoftware Architectとして頑張って働いていた米国でスマートホームを開発するスタートアップ「HOMMA」からレイオフされ、事業を離れることになりました。入社時の夢いっぱいのブログエントリーはこちらからどうぞ。 ※ この記事は退職エントリーです。興味のある方だけお読みください。 何を作っていたの?最終的にどんなものを作ってたの?と思われると思うので、開発したプロダクトのデモを貼っておきます。ちなみに、この動画を作ったのも自分です。私物のBlackmagick Pocket Cinema Camera 4Kを持ち込んで、ポートランドの寒空の下、1人で撮影&編集しました。 タッチパネルが壁一面にあったり、音声クライアントやアプリで操作するドヤ!っとしたスマートホームではなく、埋め込まれたセンサーが人間の

    米国でスタートアップの要職をやってたけどレイオフされてしまった話|井上恭輔(きょろ)
    kanda_k
    kanda_k 2025/01/06
  • GitHub Actionsで定期実行(cron)のワークフローを組んだユーザーが退職すると、ワークフローは無効化される - shmokmt's blog

    GitHub Actionsで定期実行(cron)のワークフローを組んだユーザーが退職すると、ワークフローは無効化される 大事なことなので、見出しでも同じことを書いてしまいました。 何を言っているんだという感じですが、とにかくそういうことらしいです。 厳密には最後にワークフローにコミットしたユーザーが組織から削除されると、無効になるようです。 GitHub Actionsの定期実行でPR作成を自動化*1している会社もそれなりにあるかと思うのですが、その場合はそれらが全部停まります。 さらに、1度無効化されてしまった場合はcron式を変更しないといけないというのも罠ポイントですね。 最後にワークフローの Cron スケジュールにコミットしたユーザーが組織から削除されると、スケジュールされたワークフローは無効になります。 リポジトリへの write アクセス許可を持つユーザーが Cron スケ

    GitHub Actionsで定期実行(cron)のワークフローを組んだユーザーが退職すると、ワークフローは無効化される - shmokmt's blog
    kanda_k
    kanda_k 2025/01/06
  • エスマットのアウトプット施策を振り返る

    この記事は SMat Advent Calendar 2024 の12月25日分の記事です。 こんにちは、株式会社エスマットでエンジニアリングマネージャーを担当している仙葉です アドベントカレンダー最終日です!弊社としては初めての挑戦でしたが、なんとか予定していた通り投稿が実施され完走することができました🎉 今回はアドベントカレンダーの取り組みを振り返りつつ、弊社のアウトプット施策についてお話ししていきたいと思います なぜアドベントカレンダーを始めたのか 弊社では以前からテックブログとZennに記事の投稿を行なっておりました しかし、メンバーの入れ替わりに伴い管理者なども変更されており、今年に入ってから投稿数が減少していました そこで外部アウトプット改善に向けて動き出すにあたり、目をつけたのがアドベントカレンダーです 毎年盛り上がっており、さまざまな記事が投稿されるため読むだけでも大変な

    エスマットのアウトプット施策を振り返る