はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    WWDC25

『zenn.dev』

  • 人気
  • 新着
  • すべて
  • AI Agentの評価指標まとめ

    67 users

    zenn.dev/neoai

    はじめに こんにちは.株式会社neoAIの研究開発組織 (neoAI Research) / 東京都立大学の板井孝樹です. 昨今LLM based Agentの開発が盛んですが,実ユースケースへの応用においては多角的な評価が必要となります.そもそも"良いAgent"がどのような評価観点が求められるのかを知ることで,良い開発・価値提供が実現可能だと考えます. 本記事では,まずLLM Agentに求められる要素能力に関する評価観点についてまとめます.そしてこれらの要素能力を包括して遂行する必要のあるタスクに関する評価指標についてもまとめます.特に昨今のビッグテックのリリース時によく用いられる評価指標をベースに調査を行いました. LLM Agentの評価指標のサーベイに関する先行の取り組みとして,Yehudaiらの"Survey on Evaluation of LLM-based Agents

    • テクノロジー
    • 2025/05/03 18:22
    • AI
    • あとで読む
    • 人工知能
    • LLM
    • 論文
    • techfeed
    • SaaSにおけるIdP実装の抽象化とDI活用による柔軟な設計

      5 users

      zenn.dev/neoai

      1. はじめに はじめまして、株式会社neoAIでソフトウェアエンジニアをしている加藤と申します。 SaaSプロダクトを開発していると、クライアントや環境ごとに異なる認証方式に対応する必要があります。オンプレミス環境、クラウド環境、大手企業からスタートアップまで、多様なニーズに応えるためには、IdP(Identity Provider)を柔軟に切り替えられる仕組みが求められます。 以前、弊社のMoriyasuが執筆した「FastAPI の Dependency Injection (Depends + Injector)」では、FastAPIとDIの基本的な活用方法や、プロダクトへの導入事例をご紹介しました。 本記事ではそれを踏まえ、FastAPIのDIを活用して、SaaSプロダクトにおけるIdP(Identity Provider)の実装をいかに抽象化し、柔軟に切り替え可能な構成を実現す

      • テクノロジー
      • 2025/04/20 08:07
      • あとで読む
      • LLM x Slack x Notion で論文インプットを効率化し、社内ナレッジ蓄積もできるようにした話

        204 users

        zenn.dev/neoai

        はじめに 株式会社 neoAI の大坂洋豊です。東京大学に在学中で、松尾・岩澤研究室に所属しています。AI ソリューション事業部として、プロジェクトマネジメントを行いながら、研究開発組織 neoAI Research として先端技術の実践に取り組んでいます。 今回は、弊社の Slack 上で論文のインプットを効率化するために開発した LLM Bot についてご紹介します。開発したのは2023年で、当時は NotebookLM のようなサービスがまだ存在しなかったため、社内では論文の概要をスピーディーに把握できる点で重宝されていました。また、その要約結果を社内のデータベースに蓄積できるという機能もあるため、弊社のナレッジ基盤を支えている存在でもあります。 AI ソリューション事業部についてはこちらを参照ください。 背景と課題 論文を読む文化の重要性 AI ソリューション事業部では、常に最新の

        • テクノロジー
        • 2025/03/23 09:59
        • LLM
        • あとで読む
        • notion
        • AI
        • slack
        • 論文
        • bot
        • api
        • 人工知能
        • 開発
        • RAG・AI Agentを支えるRetriverの基礎知識と実装まとめ

          6 users

          zenn.dev/neoai

          はじめに 株式会社neoAIの研究開発組織 (neoAI Research) / 東京大学の竹本健悟です。 巷では昨年からRAG(Retrieval Augmented Generation)、そして最近ではAI Agentが大いに注目を集め世間を騒がせていますね。 これらの技術を活用して、社内ドキュメントを外部知識としてLLMに提供するアプリケーションを構築する際、実運用に足る精度を出すためには質問に対して適切なドキュメントを高精度で取得することが最も重要なカギとなります。 今回はそんなRAG・AI Agentの中核を担うRetrieverについて、ベクトル検索やキーワード検索といった代表的な手法や評価指標まで基礎的な知識を網羅的に解説していきます。 オープンソースのベクトルDBであるQdrantを用いた日本語キーワード検索の実装方法や、AWS、Microsoft Azure、GCPとい

          • テクノロジー
          • 2025/01/19 12:10
          • AI
          • あとで読む
          • FastAPI の Dependency Injection (Depends + Injector )

            5 users

            zenn.dev/neoai

            はじめまして、株式会社 neoAI というところでソフトウェアエンジニアをしている Moriyasu といいます。 今回は弊社として初めてのソフトウェアのブログを担当させていただくことになりました。 さて、年末年始はみなさんいかがお過ごしでしたか? 僕は暇だったので、自社プロダクトを Flask から FastAPI に移行するコーディングをずっとやっていました。FastAPI を"完全に理解"したので、今回は FastAPI での Dependency Injection (依存性の注入) について解説します。 前提 今回出てくる技術について先にさらっておきます。 FastAPI: 高速でモダンな API を構築するための Python フレームワーク SQLAlchemy: Python の ORM ライブラリ Injector: Python の Dependency Injecti

            • テクノロジー
            • 2025/01/15 07:29
            • FastAPI
            • Python
            • あとで読む
            • 2024年 ビッグテックのAI Agent 動向まとめ

              71 users

              zenn.dev/neoai

              はじめに 株式会社neoAIの研究開発組織 (neoAI Research) / 東京大学の大槻真輝です。 最近LLMの推論能力の向上によりAI Agentがトレンドになりつつあります。また、MicrosoftやAmazonなどのビッグテックもAI Agentをテーマに様々なプロダクトやサービスを展開し始めています。 そこで今回は2024年4月にIBMとMicrosoftが出したAgentに関するサーベイ論文「The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey」 を軸にGoogle、AWS、Microsoft、OpenAI、AnthropicのAgentに関する動向や立ち位置を整理したいと思います。 論文概要 エージェントとは? 2023年の

              • テクノロジー
              • 2024/12/29 02:57
              • AI
              • あとで読む
              • 人工知能
              • techfeed
              • language
              • *あとで読む
              • 論文「RAG VS Fine-tuning」を読む

                4 users

                zenn.dev/neoai

                「RAG vs Fine-tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture」サマリ LLMアプリケーション構築における2つのアプローチ「RAG」と「Fine-tuning」を比較した論文 ビジネスで求められる特定領域のQAタスクの性能を農業に関するデータセットで比較した。 実験結果を見る感じ、RAGの方がFine-tuningより精度は同じか高く、イニシャルコストが低いから良さそう データセットと前処理 3つの農業に関するデータセット USA the United States Department of Agriculture のオンラインで公開されているPDFデータを前処理 573の書類、2Mトークン Brazil ブラジルの作物栽培と管理のQAデータセット「500 Questions 500 Answers -

                • テクノロジー
                • 2024/02/01 00:29
                • あとで読む

                このページはまだ
                ブックマークされていません

                このページを最初にブックマークしてみませんか?

                『zenn.dev』の新着エントリーを見る

                キーボードショートカット一覧

                j次のブックマーク

                k前のブックマーク

                lあとで読む

                eコメント一覧を開く

                oページを開く

                はてなブックマーク

                • 総合
                • 一般
                • 世の中
                • 政治と経済
                • 暮らし
                • 学び
                • テクノロジー
                • エンタメ
                • アニメとゲーム
                • おもしろ
                • アプリ・拡張機能
                • 開発ブログ
                • ヘルプ
                • お問い合わせ
                • ガイドライン
                • 利用規約
                • プライバシーポリシー
                • 利用者情報の外部送信について
                • ガイドライン
                • 利用規約
                • プライバシーポリシー
                • 利用者情報の外部送信について

                公式Twitter

                • 公式アカウント
                • ホットエントリー

                はてなのサービス

                • はてなブログ
                • はてなブログPro
                • 人力検索はてな
                • はてなブログ タグ
                • はてなニュース
                • ソレドコ
                • App Storeからダウンロード
                • Google Playで手に入れよう
                Copyright © 2005-2025 Hatena. All Rights Reserved.
                設定を変更しましたx