並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 12 件 / 12件

新着順 人気順

lambda web adapter fastapiの検索結果1 - 12 件 / 12件

  • AWS LambdaでRemote MCP Serverをほぼ無料でホスティングする

    背景 以前はClaudeに記憶を与えるLocal Memory MCPを作った記事を作成した。 その後すぐ、Claude MobileがRemote MCPを対応したため、どうしてもスマホで使うClaudeも記憶を持たせてほしいのでLocal MCP Serverをリモート化したくてAWS Lambdaで実装した。 なぜLambdaなのか? サーバーレスでイベント駆動 私のユースケースとしてはClaudeと会話するときに、必要な場合はMemory MCPに私に関する記憶を取り出したり、記憶を作成したりするものだ。 そのため、1日多くても数十回使うようなものであり、サーバーを常時起動する必要がなく、イベント駆動のLambdaに非常に合うものであった。 個人利用はほぼ無料枠で完結 AWS Lambdaの無料枠は以下の通りだ。 毎月100万リクエスト無料 毎月40万GB秒の実行時間無料 私の場合

      AWS LambdaでRemote MCP Serverをほぼ無料でホスティングする
    • 数GBのLLM用モデルを、LambdaでLinuxシステムコールを駆使して本番水準で動かす - Nealle Developer's Blog

      はじめに お疲れ様です。2357giです。先日のre:Inventで参加したセッション「Build high-performance inference APIs with Lambda SnapStart」にて、「数GB級のLocal LLMをサーバレスで、本番環境の要求水準で動かす」方法を学んできました。 (その際のセッション形式が「チョークトーク」というもので、めちゃめちゃ良い体験だったのですがその話はこちら ) llama.cppなどの比較的軽量なLLM(1GB~5GB)や、それらと同程度のサイズの自作モデルをLambdaを用いて動かすというものです。 bedrockにカスタムモデルインポートがある現在、本アーキテクチャに優位性があるケースは多くないと思います。セッション中でも「YOLOなどの画像認識や、10 GBに収まる言語モデル、文字起こしなどのモデル組織に合わせてカスタム化さ

        数GBのLLM用モデルを、LambdaでLinuxシステムコールを駆使して本番水準で動かす - Nealle Developer's Blog
      • GitHub - modelcontextprotocol/servers: Model Context Protocol Servers

        Official integrations are maintained by companies building production ready MCP servers for their platforms. 21st.dev Magic - Create crafted UI components inspired by the best 21st.dev design engineers. 2slides - An MCP server that provides tools to convert content into slides/PPT/presentation or generate slides/PPT/presentation with user intention. ActionKit by Paragon - Connect to 130+ SaaS inte

          GitHub - modelcontextprotocol/servers: Model Context Protocol Servers
        • ドキュメント検索MCPサーバを作ってみた【MCP+OpenSearch+AWS】

          はじめに こんにちは、SREチームの鈴木です。 SREチームでは、開発リソースの20%を目安にメインプロジェクト以外の「自チームの運用課題の解消」に取り組むことができます。 現在、AWS・New Relic・TiDB など開発部で利用する複数のSaaSを管理しており、問い合わせ対応にかかる工数が課題になっています。これを解決するため、各サービスの公式ドキュメントを参照して正確な回答を返す MCP サーバーを作って、実験的に導入してみました! 今後は費用対効果を計測しつつ、効果が見込める場合には改善点を洗い出してブラッシュアップしていきたいと思います。 本記事では、OpenSearch と FastAPI によるドキュメント検索システム、および FastMCP を用いた MCP サーバーの実装をサンプルコードとともに解説します。 完成品のデモ Claude Desktop から TiDB の

            ドキュメント検索MCPサーバを作ってみた【MCP+OpenSearch+AWS】
          • AWS Lambda(Python)でAmazon Bedrockの出力をレスポンスストリーミング対応してみた - Taste of Tech Topics

            こんにちはイワツカです。 今年の夏は、特に猛暑日が続いていたので、例年にも増して素麺を食べてました。 さて今回は、AWS Lambda(Python)でLambda Web Adapterを用いてレスポンスストリーミングする方法を試してみたので紹介します。 1. 概要 1.1 レスポンスストリーミングとは? 1.2 Lambda Web Adapterとは? 2. アプリ作成 2.1 実行環境 2.2 ディレクトリ構成 2.3 FastAPIの実装 2.4 Streamlitの実装 3. アプリを動かして見る 3.1 チャットアプリをデプロイ 3.2 Streamlitを起動する 3.3 チャットを試してみる 4. まとめ 1. 概要 1.1 レスポンスストリーミングとは? レスポンスストリーミングとは、HTTPリクエストに対してサーバーがレスポンスを一度にまとめて送るのではなく、データを

              AWS Lambda(Python)でAmazon Bedrockの出力をレスポンスストリーミング対応してみた - Taste of Tech Topics
            • Lambdaでコンテナを動かすLambda Web Adapterって実際どうなの? ~NestJSのコンテナをLambdaにデプロイする~

              Lambda Web Adapterとは? 一言で言うと、「様々なWebフレームワークで作られたコンテナで動くWebアプリを、超簡単にLambdaで動かせるようにする」仕組みです。 この、超簡単にというところがポイントで、本当に超簡単です。 具体的には、Webアプリ用のDockerfileに以下の1行追加するだけでLambda Web Adapterが使えるようになります。 以下の公式のドキュメントに記載のある通り、公式の実装例では以下のフレームワークが例として挙げられているようですが、基本的には任意のWebフレームワークで動作します。 Python : FastAPI, Flask Node.js : Express.js, Next.js Java : SpringBoot Rust : Axum Go : Gin 実際に、NestJSに関しても動作することが確認できたので、その内容に

                Lambdaでコンテナを動かすLambda Web Adapterって実際どうなの? ~NestJSのコンテナをLambdaにデプロイする~
              • AWS Lambda Web AdapterとFastAPIで作る!Amazon BedrockのストリームAPIを使ったチャットアプリ | DevelopersIO

                生成AIのストリームAPIを活用したアプリケーション開発の機会が増えています。 フロントエンドはAPIを動作確認できれば良い 当面(開発中)はランニングコストを抑えたい 将来的なECSへの実行基盤の移行に対して、改修コストを抑えたい このような要件に対して、AWS Lambda Web Adapterを使ってSPAなウェブアプリケーションをLambda関数として動作させる方法を紹介します。 ※ 引用元 https://github.com/awslabs/aws-lambda-web-adapter/blob/main/examples/fastapi-response-streaming/imgs/serverless-storyteller-architecture.png 本記事では、サーバーサイドフレームワークにFastAPI、ストリームAPIにAmazon BedrockのInv

                  AWS Lambda Web AdapterとFastAPIで作る!Amazon BedrockのストリームAPIを使ったチャットアプリ | DevelopersIO
                • AWS Lambda Pythonでsqlite-vssによるベクトル検索を利用する - maybe daily dev notes

                  昨今LLMの台頭により、テキストをベクトル化して類似文書の検索に利用する手法が流行っています。 今回はAWSでこの検索を実現するための一方法として、SQLiteのプラグインであるsqlite-vssをAWS Lambda上で使う方法をまとめます。 github.com 意外とハマりどころや特有の考慮事項が多いので、必見です! アーキテクチャ LambdaでSQLite?と思った方のため、このアーキテクチャの要点をまとめます。 このアーキテクチャのメリットは、完全なサーバーレスでベクトル検索を実行できる点です。OpenSearchやPostgres (pgvector)、Redisなどのインスタンスを管理する必要はありません。サーバーレスの利点はもはや言うまでもないでしょう。 また、SQLiteを使うため、ベクトルだけでなく他のリレーショナルなデータをあわせて格納できる点も便利でしょう。例え

                    AWS Lambda Pythonでsqlite-vssによるベクトル検索を利用する - maybe daily dev notes
                  • Amazon Bedrockを使ってClaudeを業務利用したい! - Qiita

                    Anthropic Claude Advent Calendar 2023 の 13日目の記事です。 業務でLLMを活用したい LLMってすごく便利ですよね! できることなら、業務に使って生産性を爆上げしたいですよね! LLMのサービスを使いたいけど、社外サービスの業務利用が制限されていたり、利用申請が大変だったりする会社も多いのではないでしょうか? この記事を読んでいる方の中に、「既にAWSの社内申請は通っていて、AWSは比較的自由に使える」という方はいませんか?その方に朗報です! AWSで簡単にLLMチャットアプリを構築するアセットをご紹介します! bedrock-claude-chat AWSサービスだけで、LLMチャットが実現できるbedrock-claude-chatを開発したので、そちらをご紹介します!(日本語マニュアルはこちら) こちらは、GitHubのaws-samples

                      Amazon Bedrockを使ってClaudeを業務利用したい! - Qiita
                    • 例:Lambda Web Adapter + FastAPIによるAPI開発

                        例:Lambda Web Adapter + FastAPIによるAPI開発
                      • デモ実装で考えるStrands Agentsのいいところ

                        2025年5月、AWSからStrands AgentsというAIエージェントフレームワークが公開されました。 昨今数多のAIエージェントフレームワークがある中で、Strands Agentsを選ぶ価値を探るべく実際に触ってみたいと思います。 その触る過程として、今回はStrands Agentsによるエージェントアプリケーションとそれが使用するMCPサーバーを開発してみます。 まずは完成物から デモ 今回作成したデモアプリケーションはこんな見た目です。 ごく単純なチャットボットですが、ユーザーの要望に応じて現在時刻を取得するツール、CloudTrailからの履歴を取得するツールを使って回答を生成します。 なお、現在時刻の取得はエージェントが内部に持つ組み込みツールで、CloudTrailの履歴取得はAWS Lambdaに構築したリモートMCPツールを呼び出しています。 GitHubリポジト

                          デモ実装で考えるStrands Agentsのいいところ
                        • Lambda Web AdapterでrequestIdをログ出力する - あしたから本気だす

                          素の Python Lambda だと logging モジュールを利用することで簡単に requestId をログに出力することができます。requestId があると、CloudWatch Logs Insights で requestId でフィルターできるためエラーが発生した際のログ調査を迅速に行うことができて便利です。 import logging logger = logging.getLogger() logger.setLevel("INFO") def lambda_handler(event, context): logger.info("test") しかし、Lambda Web Adapter だとそうはいきません。FastAPI を利用して同じように実装しても requestId は出力されません。 import logging from fastapi impo

                            Lambda Web AdapterでrequestIdをログ出力する - あしたから本気だす
                          1