タグ

Pythonに関するmkusakaのブックマーク (57)

  • Gemini 3 Flash の新機能 Agentic Vision の概要|npaka

    「Gemini 3 Flash」の新機能「Agentic Vision」の概要についてまとめました。 ・Introducing Agentic Vision in Gemini 3 Flash 1. はじめに「Gemini 3 Flash」の「Agentic Vision」は、画像理解を静的な行為からエージェント的なプロセスへと変換します。視覚を能動的な調査として扱います。「Agentic Vision」が最初にサポートしたツールの1つであるコード実行とVisual Reasoningを組み合わせることで、モデルは画像を拡大・検査・操作するための計画を段階的に策定し、視覚的な証拠に基づいて回答を導き出します。 「Gemini 3 Flash」でコード実行を有効にすると、ほとんどのVisionベンチマークにおいて一貫して5~10%の品質向上が実現します。 2. Agentic Vision:

    Gemini 3 Flash の新機能 Agentic Vision の概要|npaka
    mkusaka
    mkusaka 2026/01/29
    Gemini 3 FlashのAgentic Visionは、Pythonコード生成で画像を能動的に操作し、コード実行でほとんどのVisionベンチマークで一貫して5~10%の品質向上を実現します。
  • RAGの取りこぼしを減らすには? — Corrective RAG で検索ミスを“後から直す”

    はじめに ルミナイR&Dチームの栗原です。 前回の記事では、Self-RAG を題材に、 Retrieve / Generate / Critique の三段構えで LLM 自身に「検索する?」「この回答どう?」を考えさせる仕組み Reflection Tokens(<RET> や ISREL / ISSUP / ISUSE)のアイデア それを OpenAI + 既存RAG で真似する「Self-RAG もどき」実装 をざっくり整理しました。 Self-RAG の視点はどちらかというと、 モデル側に自己批評させて、 “いつ・どれだけ検索するか” を賢くする という方向でした。 一方、RAG にはもう一つ大きな問題があります。 retriever が外して 関係ない or 古いドキュメント を持ってくると… LLM はそれを「根拠」だと信じて、 もっともらしい誤答(幻覚)を増幅してしまう こ

    RAGの取りこぼしを減らすには? — Corrective RAG で検索ミスを“後から直す”
    mkusaka
    mkusaka 2026/01/08
    OpenAIと既存RAGだけで、retrieval evaluatorでCorrect・Ambiguous・Incorrectを判定し、CRAG風にルーティングするPython実装例を紹介
  • Pythonパッケージ管理ツール「uv」はなぜこれほど爆速なのか?

    新人に「uv使いなよ」と言った手前、なぜ爆速なのか気で調べてみた結果 最近、チームに入ってきた新入社員の環境構築を手伝っていたときのことです。 pip でライブラリを入れている彼を見て、私は反射的にこう言いました。 「あ、今は uv を使ったほうがいいよ。とにかく速いから」 素直に uv を導入して「うわっ、当に一瞬ですね!」と驚く彼を見て満足した私ですが、デスクに戻ってふと冷や汗が出ました。 (……あれ? 待てよ。なんで uv ってこんなに速いんだっけ?) 「Rust製だから」という定型句は知っています。でも、それだけで10倍以上も差が出るものなのか? もし彼に「Rustだと具体的になにが違うんですか?」と突っ込まれたら、私は答えられるだろうか? 先輩風を吹かせた手前、これはマズい。そう思って慌てて調べてみると、uvの速さの秘密は単なるプログラミング言語の違いではなく、 「Pytho

    Pythonパッケージ管理ツール「uv」はなぜこれほど爆速なのか?
    mkusaka
    mkusaka 2026/01/01
    uvはpipがsetup.py実行や.egg処理を排除し、pyproject.tomlだけで依存解決し、Rustの高速起動と並列I/Oでインストールを一瞬にするツールです。
  • 実務レベルで最適化のコードを書く時の設計

    この記事は数理最適化アドベントカレンダー 2025 12/24 で投稿予定だったけれど間に合わなかったものです。 1 日遅れたら既に代理の記事が投稿されていて、これだけ書いてくれる人がたくさんいるならアドベントカレンダーもうひとつ作っておけば良かったなぁと思うなどしました。 はじめに アドベントカレンダーのネタに悩んで過去の記事を見ていたところ、2022 年の岩永さんの記事がふと目に入りました。 そういえば、最適化でソルバーを使う時のコードってサンプルコードや実験用のコードが多いので、こういう記事が増えて皆がどんな設計をしているのか参考にできると嬉しいですよね。 岩永さんの記事でも次のような記述があったので、実務で同じ問題を扱うならこう書くという構成を自分でも用意してみました。 記事では、数理最適化プログラムのクラス設計の一例を紹介しました。来、クラス設計は自由であるものですが、数理最

    実務レベルで最適化のコードを書く時の設計
    mkusaka
    mkusaka 2025/12/29
    SCIPとInvokeで構築した最適化テンプレートを提示、optimizers配下にProductionPlannerクラスや可視化visualizerを配置し、ディレクトリ構成とタスクランナーを解説
  • Kaggle Expertになるまで勉強したことを全て書く - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに こんにちは。Yuki | Kagglerです! 先日、Shopeeコンペの順位が確定して銀メダルをいただき、晴れてCompetition Expertになることができました。区切りがいいのでここまで取り組んできたことをまとめてみました。 ※ 6/28追記:Amazonのリンクが切れていたので貼り直しました! プログラミング&機械学習を始めて一年、ようやく Kaggle Expertになることができました!! 行列も正規分布も知らず、ターミナルなんて触ったこともない状態からのスタートでしたが、ようやくここまで来ました。 ここまで

    Kaggle Expertになるまで勉強したことを全て書く - Qiita
    mkusaka
    mkusaka 2025/12/27
    Shopeeコンペで銀メダル取得しCompetition Expertに。Python基礎、Udemy講座、G検定、Titanicなど多数コンペを攻略した学習ロードマップを公開。
  • DuckDB をつかってローカルなRAGを実装する

    この記事は Ubie Advent Calendar 2025 17日目の記事です。 最近Googleが File Search API を公開しました。使い方はとても簡単で、ファイルをアップロードするだけでGeminiから参照してRAGを実現できるようになります。これまでRAGは避けては通れないけど考えることが多くて面倒だったところが、一気に解消しそうです。ただ、自分としてはRAGにあまり手を出してこなかったのでRAGの構築がどれくらい泥臭いのかを知らないなと思いました。そこで、これを機にローカルで動くRAG環境を基礎的な部分から構築してみたので、そこで得た気づきなどを共有しようと思います。 作ってみたもの 実装した主な機能は以下の通りです。RAGというと何らかの vector store や全文検索エンジンを利用するのが正攻法だと思いますが、今回は分析への利用のしやすさやその拡張性、お

    DuckDB をつかってローカルなRAGを実装する
    mkusaka
    mkusaka 2025/12/23
    DuckDBとVSS拡張でベクトル+BM25ハイブリッド検索を実装し、ローカルディレクトリ監視・自動インデックス構築やα=0.75の重み付きRRF統合を提供するRAG入門
  • Build Your Own Operator on macOS - Part 2 - Cua Blog

  • Upcoming pybotters 2.0

    この記事は「仮想通貨botter Advent Calendar 2025」の 13 日目の記事です。 TL;DR こんにちは、botter の皆さん! 暗号通貨 botter 向け OSS ライブラリ pybotters をメンテしているまちゅけんです。 現在、次期バージョンである pybotters 2.0 の開発をしています 🔥🔥 この記事では pybotters 2.0 のコンセプトや新機能、また 1.x 系から何が変わるのか? と言う事をご紹介させて頂きます。 主要点としては以下の通りです: ✨ より使いやすい Unified Client ✨ 完全な静的型付け、データモデル ✨ 同期処理と非同期に対応 ✨ テスト可能なモックサーバー ✨ PerpDEX への対応 pybotters (1.x) とは? まずそもそも pybotters とは何か? と言う点について簡単に説明

    Upcoming pybotters 2.0
    mkusaka
    mkusaka 2025/12/15
    暗号通貨向けOSS pybotters 2.0の新設計を解説。Unified Client/静的型付け/モックサーバー等、2.0は後方互換なし。
  • Notebook LM に Kindle 本を突っ込む - set setting reset

    Notebook LM にを突っ込むとポッドキャストを生成してくれる機能を愛用しています。 生成されたマインドマップを見ながらポッドキャストを聞き、深堀りしたい部分を実際に読んだり、他の記事などもソースに突っ込んで分析するなど読書体験が令和になりました。 o'reilly ebook は PDF もあるため、それを突っ込めばいいのですが、 Kindle はそうもいきません。 いくつか検索した結果、ソリューションとして、 KIndle をスクショする スクショした画像を PDF 化する PDFNotebook LM にアップロードする という方式がよさそうです。 最近 NotebookLM が画像アップロード機能が実装されたようですが、1ノートブックに対して50ファイルが上限となると、厚いはつらそうです。 forest.watch.impress.co.jp というわけで今回は

    Notebook LM に Kindle 本を突っ込む - set setting reset
    mkusaka
    mkusaka 2025/12/15
    Kindle本をNotebookLMに入れるため、スクショ→PDF化をPythonで自動化する手順。200MB分割/rtl対応。
  • Realtime Speech to Text | ElevenLabs Documentation

    mkusaka
    mkusaka 2025/12/02
    ElevenLabs Scribe v2 RealtimeでWebSocket経由の低遅延ストリーミング音声認識を実装する手順と実装パターンを整理
  • 投資xAIで勉強してきたことまとめ

    この記事は、投資AI機械学習)の交差点に興味を持ち、実際に学習を進めてきた記録とリソースのまとめです。 記事は、マケデコアドベントカレンダー1日目の記事です。 はじめに 近年、個人のPCスペック向上やPythonライブラリの充実により、個人でも高度な金融データ分析やバックテストが可能になってきました。「投資 x AI」の領域は非常に奥が深く、どこから手をつければ良いか迷うことも多いです。 今回は、私がこの領域を学ぶにあたって実際に取り組んだMOOC(オンライン講座)、読み込んだ専門書、そしてインスピレーションを受けた読み物を体系的にまとめます。これからクオンツトレードやファイナンス機械学習を学びたいエンジニアの方々の参考になれば幸いです。 1. 手を動かして学ぶ(MOOC編) まずはPythonを使って実際にポートフォリオ構築やアルゴリズムを実装する講座です。理論だけではイメージしづ

    投資xAIで勉強してきたことまとめ
    mkusaka
    mkusaka 2025/12/02
    投資×AI入門の学習ロードマップ。Coursera講座やActive Portfolio Management、デ・プラド本、NumeraiやJQuants API実践まで整理
  • 京大理系がPythonで「最強の株AI」を作ろうとしたら、結論が「ニュースを見て寝なさい」になった話|もんげー

    初めに忠告するが、私は国語が苦手だ。なのでもし読むときはchatgpt使って、要約をかけさせることをお勧めする。 ーこの記事の要約ー ・テクニカル分析が嘘であることを検証した話 ・一番結果を出した戦略について ー次回書くことー ・AIによる取り組み①~強化学習編~ ・AIによる取り組み②~教師あり学習編~ まず、テクニカル分析は嘘であるこれは、ウォール街のランダムウォーカーというを読んでいればある程度知っている話であろう。それにこの話は何十年も前から言われていることである。しかし、SNSではチャートを見ては”俺はこの形しか信じない”、だの、”結局これ(ぎざぎざと直線ががいっぱい書いてある画像)”みたいな投稿がバズっている。それを見るたびに、嘘つけよ、とか思っていたが、自分で検証してみないと信じれない性格なので検証してみた。 テクニカル分析を駆使して売買した時の勝率(60個の指標の内、上位

    京大理系がPythonで「最強の株AI」を作ろうとしたら、結論が「ニュースを見て寝なさい」になった話|もんげー
    mkusaka
    mkusaka 2025/12/02
    京大理系がPythonでテクニカル60指標を検証し、勝率49.27%と否定しつつ、半年毎に上昇率上位5銘柄へ等配分するモメンタム・ローテーション戦略とその限界を解説
  • FastAPIのテストコードを書いてDIの重要性を知った話

    きっかけ こんにちは、ランサーズでエンジニアをしている岡田です。 当時は開発スピード優先でテストコードなんて二の次。 DIの概念は知りつつも、「DIを意識した開発コードって?」「DIを意識すると何が良いの?」と分からないままでした。 それでも、FastAPI+sqlalchemyの開発では、DBを使う時に大抵エンドポイントの引数にdb: Session = Depends(get_db)が出てきます。 「どうしてエンドポイントの内部ではなく引数で書くのか?」といまいち納得しないまま、FastAPIの書き方に従っておまじないのようにDependsを書いてました。 そして、開発コードも増えて「ずっと手動でテストしてるわけにもいかないし、そろそろテストコードを書いて品質担保しないとな」と重い腰を上げた時、とうとうDIの重要性とDependsの真価を実感することになりました。 そもそもDI(Dep

    FastAPIのテストコードを書いてDIの重要性を知った話
    mkusaka
    mkusaka 2025/11/29
    FastAPI+sqlalchemyのテストでDIの重要性を解説。Dependsとapp.dependency_overridesでget_dbをSQLite(test.db)へ差し替える例。
  • AWS製OSS「Strands Agents」で作る自作AIエージェント | ドクセル

    mkusaka
    mkusaka 2025/11/22
  • Building a Deep Research MCP Server | OpenAI Cookbook

    mkusaka
    mkusaka 2025/10/26
    Deep Research向けMCPサーバ最小例。Search/FetchでOpenAI file storage検索・取得、SSEはhttp://0.0.0.0:8000/sse/で起動。
  • プロンプトエンジニアリングを終わらせるDSPy

    はじめに DSPyに夢中である。DSPyの最も重要な点は、手動のプロンプトエンジニアリングを排除できる可能性を秘めていることだ。可能性を秘めているだけで、現状、手動のプロンプトエンジニアリングが完全に不要になったわけではないのだが、こちらの分野を真面目に学ぶ動機として十分だ。使い心地というか、真面目にこの分野やってみようと思ったのはPFNのChainerを初めて触ってみたときの感覚に似ている。その後、PyTorchが出現し、すごいスピードで技術とツールが進歩していく中で、学んだことをまとめるためにブログを書き始めたのを思い出した。 DSPyがディープラーニングのフレームワークであるPyTorchやChainerに似ているのは表面上の使い心地だけの話ではない。わざわざプログラムの書き心地がこうなったのは、「これまで人手で頑張ってきたことを、パラメータにおきかえてしまい、教師データでガバっと訓

    プロンプトエンジニアリングを終わらせるDSPy
  • BrowserPod — Code Sandboxes that run in the browser

    Code Sandboxes in your browser Instant, in-browser code sandboxes for Node.js, Python, and Ruby on Rails to power the future of Web-based developer experiences. See BrowserPod in action A full Vite + Svelte full-stack development environment, running fully in-browser, with public URLs.

    mkusaka
    mkusaka 2025/10/03
    ブラウザ上でNode.js環境を即起動し、WebAssemblyベースのコンテナで公開ポータルも提供するフルスタック開発サンドボックス
  • 「解像度」込みで、requests代替を選ぶとするなら #こまPy|Atsushi Shibata

    ライブラリの選定には色々な視点が必要ですね。パフォーマンスはそのうちの一つに過ぎません。 功夫の高そうな方から、私が知らなかったことを含めた反応を頂いたので、感謝の意味を込めて返礼という形で一言書きたいと思ってパソコンに向かっています。 私の視点私の記事を書いたときの視点をまず明確にしておきたいと思います。あまり詳しいことを考えずrequestsを選ぶ様な技術的解像度を持った方に対してお勧めの代替ライブラリはなにか、ということを重視しました。移行が簡単で、インタフェースも似ている、というのが望ましい。 httpxは、学び始めの「理解の解像度」を無理に上げすぎず、低~中解像度でも実務に使える一方で、慣れてきたら高解像度(非同期・HTTP/2・細かな制御)へ滑らかに拡張できるのがお勧めできるポイントです。aiohttp は強力ですが、最初から高解像度の世界観を要求しがちで、導入フェーズの認知負

    「解像度」込みで、requests代替を選ぶとするなら #こまPy|Atsushi Shibata
    mkusaka
    mkusaka 2025/09/28
    初心者向けにrequests代替はhttpxを推奨—requestsと似たAPIでAsyncClient・HTTP/2が利用可能、型ヒントやテスト容易性もサポート
  • Protovalidate is now v1.0

    mkusaka
    mkusaka 2025/09/14
    Protovalidateがv1.0リリース。Go・Java・Python・C++・TypeScript対応で、Microsoftなどが採用。
  • adk-samples/python/agents/gemini-fullstack at main · google/adk-samples

    mkusaka
    mkusaka 2025/09/02
    ADKサンプルのgemini-fullstackはDeep Searchへ改名され、新テンプレadk@deep-searchに移動しています。