タイトルでもうオチてる感じがしますが、API仕様書を読み込むMCPサーバーを自作したところ、開発が爆速になったので紹介します。普段Androidのアプリ開発をしている人間です。 MCPとは? LLMに対してコンテキストを与えるためのプロトコルです。 今回はAPI仕様書を読み込むMCPを作るので、ざっくり言うとClineやClaude for Desktop、GitHub Copilot Agentなど、MCPに対応したツールがAPI仕様書に基づいてコードを書いてくれるようになります。 何が嬉しいのか? 例えば、以下のような質問・指示ができるようになります。 決済に関連するAPIを列挙し、Markdown記法でまとめて ドメインクラスを作りたいので、User をKotlinのdata classで出力して Androidアプリの NotificationRepository.kt に書いてあ
Git Credential Manager (GCM) でGithubへの認証をセキュアに実現する (Windows, WSL2, Linux) Githubのリポジトリへ接続する際の認証方法としては、パスワード認証、パーソナルアクセストークンよる認証、SSH認証等がありますが、パスワード認証はすでに廃止されており、アクセストークンは用途別にパスワードを管理する必要がありますし、あまりセキュアな認証方法とは言えません。SSHはセキュアで良いのですが、秘密鍵の管理を行う必要があります。 こういった課題に対応するのがGit Credential Manager (GCM)です。gitコマンドを実行する際、初回は以下のようなUIが表示され、ブラウザに遷移して(OAuthで)Github.comにログインすると、その資格情報がPC内に保存され、以降は自動的に認証されるようになります。個別にアクセ
Published Dec 19, 2024 We've worked with dozens of teams building LLM agents across industries. Consistently, the most successful implementations use simple, composable patterns rather than complex frameworks. Over the past year, we've worked with dozens of teams building large language model (LLM) agents across industries. Consistently, the most successful implementations weren't using complex fr
自然科学研究機構 核融合科学研究所 教授の高畑一也氏が、核融合発電の基礎知識について解説する本連載。第2回では、核融合炉/発電の基本的な仕組み、核融合炉に使われる主要装置について解説します。 連載の第1回では、地上で実現可能な核融合反応を提示し、この反応を実現するための条件、核融合発電の優位性と安全性について解説しました。今回は、実際の核融合炉(核融合反応を起こす場所)と発電の仕組みを解説します。核融合にはいくつかのアプローチがありますが、今回は磁場閉じ込め方式、そして第1世代といわれる重水素-三重水素(D-T)反応炉に話を絞ります。その他のアプローチについては、連載第3回で触れたいと思います。 超高温プラズマを閉じ込める磁場の容器 そもそも核融合炉で作られる1億℃の水素ガス(プラズマ)を金属の容器で閉じ込めることはできません。1億℃に耐えられる金属がないのは確かですが、それより数グラム(
はじめに これはKaggle Advent Calendar 2023の16日目の記事です. みなさん,私生活でニューラルモデル使ってますか?DeepLとかChatGPTとかではなく,皆さんが魂を込めた手元のモデルの話です. 最近のkaggleコンペの題材はかなり一般的なアプリケーションにそのまま転用できそうな話題も増えているように感じます.自分で作ったものに限らなくても,前処理だったりでネットから拾ってきたモデルも便利だったりしますよね.それ,コンペ終わったら即ポイじゃもったいなくないですか? そこでonnxruntime-webの出番です.onnxruntime-webを使うとブラウザでニューラルモデルのローカル推論ができます.この記事では特にブラウザの拡張機能でモデルを使う方法を見ていきます.ブラウザ拡張の開発はそれ自体すでに万人にお勧めしたいものですが,そこにさらにニューラルモデル
近年、PCに搭載されるメモリは爆発的に増えました。16GBや32GBのメモリが搭載されているのが当たり前の時代です。性能の制限が強いスマートフォンですら4GBほど搭載していることがあります。ストレージの読み書き速度もどんどん加速し、昔では扱えなかったようなデータ量をリアルタイムで処理できます。インターネット回線も同様に大量のデータを扱えるようになりました。 しかし現実的な大きさのデータを一度に扱おうとすると、現代でもそれなりに処理時間がかかります。ユーザはレスポンスに対して敏感で、反応が0.1秒でも遅れるとストレスを感じます。しかし時間がかかるものはかかるのです。この問題は一見どうしようもないように思えます。 そこで登場するのが「データを細切れにして処理する」というコンピュータにおける万能の薬です。細切れにして逐次処理すれば、少しずつデータを処理することができ、素早いレスポンスを実現するこ
GitHub seems to use their API to write the trending page and don't present it back as a particular API. You need to use the Repository Search API. I've followed the examples on this page, which could solve your needs by: # We'll use the `date` command to get the date for "7 days ago" $ date -v-7d '+%Y-%m-%d' # => 2013-07-15 curl -G https://api.github.com/search/repositories --data-urlencode "sort=
Hacker News Search, millions articles and comments at your fingertips.
とあるプログラミング学習サイトで以下のような講座を見つけました。 Python×AI・機械学習入門編2: 話者認識をしよう 機械学習で音声認識を行います。音声データから特徴量を抽出する方法を学習し、SVMで分類します。 とても面白そうな記事ですが、残念ながら有料プランの講座でした。 概要とコードをチラ見したところ、3人の声優を話者識別するために音声データから特徴量(MFCCなど)を抽出して、SVM(サポートベクターマシン)で分類しているようです。 Google検索してみると、話者識別の記事のほとんどがSVMを用いていますが、 「SVMは本当にベストプラクティスなのか」 「声優を100人に増やしても、高い予測精度を維持できるか」 を中心に(もちろん無料の)記事を書いていきます。 ▼ 動画の冒頭を見ていただけると、タスクの難易度と概要が分かります 0. 話者識別とは 話者認識(Speaker
2023年後半頃から、ブラウザの「戻る」ボタンを押すと、訪問したおぼえのないページが表示されることが増えた。そういうページは大抵、記事風の広告やサイト内の記事へのリンクが大量に並ぶという構成になっている。こんなレイアウトになってることが多い。 この手法はブラウザバック広告とかブラウザバックレコメンド (あるいはレコメンデーション) とか呼ばれており、国内外の複数のWeb広告会社がこれを提供しているようだ。 たとえば、こちらはGMOアドマーケティングの “TAXEL” が提供しているブラウザバックレコメンド。 【新たな収益・回遊源が誕生!】ブラウザバックレコメンド サイトから離れてしまうユーザーに対し、広告やレコメンド記事を表示させることで、収益化や内部回遊に繋げることを目的としているフォーマットになります。 ……というのがセールスポイントらしいのだが、サイトから離れる人は、サイトから離れた
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く