タグ

PythonとLLMに関するmkusakaのブックマーク (3)

  • AIエージェントが機密データを漏洩する5つの実例 — RBACでは防げない構造的欠陥 - Qiita

    実例1: EchoLeak — Microsoft 365 Copilot(CVE-2025-32711、CVSS 9.3) 攻撃者が細工したメールを送るだけで、被害者のM365データが外部サーバに流出。ゼロクリック。 Copilotが受信メール(外部データ)を読み込んだ後、その指示に従って別のデータを外部URLに送信。MicrosoftのXPIA分類器、外部リンク削除、CSPをすべてバイパスしました。 根原因: Copilotは機密メールを読んだ後も、外部への書き込み能力を保持していた。 参考: Hack The Box解説 実例2: Slack AI データ流出(2024年8月) RAGポイズニングとプロンプトインジェクションの組み合わせ。攻撃者がSlackチャンネルに悪意あるメッセージを投稿し、Slack AIが別のプライベートチャンネルの機密情報を攻撃者に回答する形で流出。 根

    AIエージェントが機密データを漏洩する5つの実例 — RBACでは防げない構造的欠陥 - Qiita
    mkusaka
    mkusaka 2026/04/04
    AIエージェントの機密漏洩5例を紹介し、RBACでは防げず感度ラチェット(agent-iam-ratchet)で一方向に不可逆縮小する考え方を提案
  • DuckDB をつかってローカルなRAGを実装する

    この記事は Ubie Advent Calendar 2025 17日目の記事です。 最近Googleが File Search API を公開しました。使い方はとても簡単で、ファイルをアップロードするだけでGeminiから参照してRAGを実現できるようになります。これまでRAGは避けては通れないけど考えることが多くて面倒だったところが、一気に解消しそうです。ただ、自分としてはRAGにあまり手を出してこなかったのでRAGの構築がどれくらい泥臭いのかを知らないなと思いました。そこで、これを機にローカルで動くRAG環境を基礎的な部分から構築してみたので、そこで得た気づきなどを共有しようと思います。 作ってみたもの 実装した主な機能は以下の通りです。RAGというと何らかの vector store や全文検索エンジンを利用するのが正攻法だと思いますが、今回は分析への利用のしやすさやその拡張性、お

    DuckDB をつかってローカルなRAGを実装する
    mkusaka
    mkusaka 2025/12/23
    DuckDBとVSS拡張でベクトル+BM25ハイブリッド検索を実装し、ローカルディレクトリ監視・自動インデックス構築やα=0.75の重み付きRRF統合を提供するRAG入門
  • プロンプトエンジニアリングを終わらせるDSPy

    はじめに DSPyに夢中である。DSPyの最も重要な点は、手動のプロンプトエンジニアリングを排除できる可能性を秘めていることだ。可能性を秘めているだけで、現状、手動のプロンプトエンジニアリングが完全に不要になったわけではないのだが、こちらの分野を真面目に学ぶ動機として十分だ。使い心地というか、真面目にこの分野やってみようと思ったのはPFNのChainerを初めて触ってみたときの感覚に似ている。その後、PyTorchが出現し、すごいスピードで技術とツールが進歩していく中で、学んだことをまとめるためにブログを書き始めたのを思い出した。 DSPyがディープラーニングのフレームワークであるPyTorchやChainerに似ているのは表面上の使い心地だけの話ではない。わざわざプログラムの書き心地がこうなったのは、「これまで人手で頑張ってきたことを、パラメータにおきかえてしまい、教師データでガバっと訓

    プロンプトエンジニアリングを終わらせるDSPy
  • 1