[B! ai][dev] ko-ya-maのブックマーク

RAGでも「深い検索」を実現する手法「DeepRAG」

本記事では、RAGの性能を高めるための「DeepRAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何 OpenAIがリリースした「Deep Research」[1]という機能が話題です。この記事は、RAGでも「Deepな検索」ができるようにする手法「DeepRAG」の論文[2]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。本題ざっくりサマリー DeepRAGは、RAGの新しい手法です。DeepRAGを使うことで、データベースを深く・網羅的に検索した上で回答するRAGを、構築することができます。中国科学院ソフトウェア研究所とWeChat AIの研究者らによって2025年2月に提案

ko-ya-ma 2025/02/12

リンク

DevinとCursorを比較してみてわかった、マルチタスクエンジニアにはDevinこそが救世主である理由

DevinとCursorを比較してみてわかった、マルチタスクエンジニアにはDevinこそが救世主である理由はじめにこんにちは。Ubieでプロダクト開発エンジニア兼社内入稿システムのPOをしている、えんぴつと申します。「完全自律型AIソフトウェアエンジニア」Devinと、次世代AIコードエディタCursor。どちらも大きく注目されていますが、「実際どう使い分けるの？」「スクラムや日常業務に組み込むには？」と悩む方も多いのではないでしょうか。私自身の業務内容としては、プロダクトの実装 Epicの立案やPBIの起票レビュー対応・ドキュメント整備採用関連やチーム外のステークホルダーとのアラインという感じで開発以外のタスクもなにかと抱えています。まとまった時間を取りづらいため、Devinのようにスキマ時間を使って開発タスクを進められる仕組みは本当にありがたいです。一方、Cursor

ko-ya-ma 2025/02/08

dev
ai

リンク

DeepSeekがやっていると噂の蒸留というやつを、ローカルLLMで今すぐやってみる前編

前提この記事では、「Symbolic Knowledge Distillation: from General Language Models to Commonsense Models」という論文で提案されている記号知識蒸留を、ローカルLLMで日本語で実験する。詳細知識蒸留 (Knowledge Distillation) とは、大きなモデル (教師) から小さなモデル (生徒) に知識を転送する手法である具体的には、LLMの蒸留と言えば、大きなモデルが出力する確率分布（ソフトターゲット）を利用して、小さいモデルを学習させる手法が用いられていたしかし、本論文では、「象徴的」な知識蒸留として、単に数値的な蒸留ではなく、テキスト (symbolic knowledge) の形で知識を抽出し転送することを提案している必要な知識と開発環境 ollamaとPythonとLang

ko-ya-ma 2025/02/03

リンク

RAGで「AIエージェント」を使う手法まとめ

本記事では、RAGの性能を高めるための「Agentic RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何この記事は、「AIエージェント」をRAGに取り入れた手法である「Agentic RAG」のサーベイ論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。本題ざっくりサマリー Agentic RAG は、RAGの新しい手法です。この論文では、「RAGにAIエージェントを使っている」とはどういう状態なのか、どんなパターンがあるのかまとめられています。クリーブランド・ステート大学の研究者らによって、2025年1月に発表された論文です。最近、「AIエージェント」が注目されてい

ko-ya-ma 2025/01/31

リンク

Sakana AI

新手法「TAID」によって学習された小規模日本語言語モデル「TinySwallow-1.5B」は、同規模のモデルの中で最高性能を達成しています。さらに、小規模のため、APIなどを介さずお手元のスマートフォンやPCで完結してチャットが可能です。ウェブアプリまたは、GitHubにてお試しいただけます。本稿は、経済産業省とNEDOが推進するGENIACによって支援されたSakana AIの研究成果を紹介するブログシリーズの第3回目です。概要日常的な対話はもとより、数学やコーティングといった複雑なタスクまでも人間と遜色ないレベルでこなせるようになった大規模言語モデル（LLM）は、今後ますます多くの場面での利活用が期待されています。こうした大きな期待の一方で、LLMの開発・活用の現場では、莫大な計算資源の必要性が大きな壁として立ちはだかってます。まずLLMの開発現場では、「大規模データと巨大計

ko-ya-ma 2025/01/31

> 新手法「TAID」を用いた小規模日本語言語モデル「TinySwallow-1.5B」の公開

リンク

DeepSeek R1 Dynamic 1.58-bit の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Run DeepSeek R1 Dynamic 1.58-bit - Unsloth 1. DeepSeek R1 Dynamic 1.58-bit「DeepSeek-R1」は、オープンでありながら、「OpenAI」のo1に匹敵することで話題になっています。「Unsloth」では、より多くのローカルユーザーがこれを実行できるようにする方法を検討し、「DeepSeek-R1 671B」を「131GB」のサイズに量子化することに成功しました。これは、非常に機能的でありながら、元の720GBから80%のサイズ削減です。「DeepSeek R1」のアーキテクチャを研究することで、特定のレイヤーを高bit (4bitなど) で選択的に量子化し、残り多くの MoEレイヤーを 1.5bitのままにすることに成功しました。すべてのレイヤーを単純に量子化

ko-ya-ma 2025/01/31

リンク

Devinがすごすぎてガチ恋Devin沼ハマりしました｜コクヨ内製開発エンジニア

はじめまして！ Devinを導入して昨日から社内で試験的に利用し始めたのですが、すごすぎて1日中Devinと会話し続けてガチ恋沼ハマりしてしまった、コクヨ開発エンジニアの伊藤と申します。このすごさを少しでもみなさんに共有したく、記事を書くことにしました！自立型ソフトウェアエンジニアリングAIのDevinの紹介の記事になります！ Devinって？Devin（デビン）とは、AIスタートアップCognition社が開発した完全自律型のソフトウェアエンジニアリングAIです。従来のテキスト対話型の生成AIとは異なり、指示をもとに自律的に一連のソフトウェア開発作業をこなしてくれるAIエージェントです。 Devinの推しポイント語らせてください！1日中触れ合って感じたDevinのすごさを事例を交えていくつか紹介します！判断が必要なときに指示を仰いでくれる！「detektのバージョンアップを行う」

ko-ya-ma 2025/01/13

リンク

思いつきで作ったAIツールが5000スターを獲得した話

とにかくケチりたい、そんな気持ちで作ったツールの話です。元々開発にCline(Claude Dev)やAiderなどの開発ツールを駆使していました。ただ、APIの料金が常に心配で、できる限り安く済ませたい気持ちもあり、Claude Proを契約してWeb版にファイルを1つ1つアップロードする日々を過ごしていました。ある日それが面倒になってきて「全部1ファイルにしたらいい感じに読み込んでくれるのでは？」と思い、作ってみたら思いのほかうまくいったので公開しました。百聞は一見にしかずということで、こちらのデモにお気に入りのGitHubリポジトリ(例: honojs/hono)を入力してみてください。 Claudeが得意とするXMLっぽいフォーマットで出力し、そのままClaudeにアップロードすることができます。完全にAIバブルの波に乗ったとも言えるのですが、多くの競合がいる中でスター

ko-ya-ma 2025/01/11

リンク

ClineとAIコーディングツールの現状 - laiso

はじめに近年、AIを活用したコーディングツールが急速に発展し、プログラマーの生産性向上や開発プロセスの効率化に大きな影響を与えつつあります。これらのツールは、コード補完、チャットアシスタント、コーディングエージェントなど、様々な形態で提供されており、プログラマーの作業をサポートしています。その中でも、オープンソースのコーディングエージェントである「Cline」は、独特のポジションと活発なコミュニティによって注目を集めています。本記事では、Clineを中心に、現在のAIコーディングツールの動向を探ります。Clineの特徴や利点、そして他のツールとの比較を通じて、AIコーディングツールの現状について考察します。また、Clineのアーキテクチャや実用面、コミュニティの動向についても解説します。 AIコーディングツールは、特に個人のプログラミングの世界に大きな変革をもたらしつつあります。本記

ko-ya-ma 2025/01/07

リンク

browser-useによるブラウザ操作自動化のサンプル集

はじめに browser-use を使う上で詳しいドキュメントがなかったので、自分で使ってみたことをまとめてみました。 browser-use の基礎的なところは以下にまとめてあります。ブラウザを起動させず、ヘッドレスモードで実行したい BrowserConfigのheadlessをTrueにすることで、ブラウザを起動させず、ヘッドレスモードで実行することができます。 from browser_use.browser.browser import Browser, BrowserConfig browser = Browser( config=BrowserConfig( headless=True, ) ) async def main(): model = ChatOpenAI(model='gpt-4o') agent = Agent( task='東京の天気をGoogleで調べて

ko-ya-ma 2025/01/05

リンク

browser-use やばいです - Qiita

はじめに語彙力なくてすみません、 browser-use は、「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。プロンプトで与えられた指示どおりに動き、ほかの技術と比較しても精度が抜群に高いです。早速試してみます。実践複数のECサイトから特定の商品価格を取得することを目標とする。 Python は 3.11 以上が必要です。

ko-ya-ma 2025/01/02

リンク

コーディングAI課金するならCodyが断トツ良い話

概要開発者向けの AI ツールは数多くありますが、その中で「Cody」は無名ながらも知る人ぞ知る優れたプロダクトです。私が普段いるAI 技術者コミュニティでは密かに絶大な支持を集めていますが、SNSなどでの一般的な知名度はほとんどないため、ここで紹介します。 Cody は無料プランが圧倒的に強い他、課金プランも、GitHub Copilot、Cursor、ChatGPT と比較して機能性で大きく抜きん出ています。私はすでに半年課金愛用していて、おそらく来年も愛用するでしょう。 Cody とはなんぞや Cody くんは、VSCode や、JetBrains IDEs、Neovim、Eclipseなどのコードエディタの拡張機能として使えるコーディング補助 AI ツールです。他の生成 AI コードツールと同様に、AI コード補完とAIチャットがあります。なぜ Cody がおススメなのか C

ko-ya-ma 2024/12/29

リンク

vLLMを利用したLLM推論高速化テクニック - Taste of Tech Topics

皆さんこんにちは Acroquestのデータサイエンスチーム「YAMALEX」のチームリーダ、@tereka114です。 YAMALEXチームでは、コンペティションへの参加や自社製品開発、技術研究などに日々取り組んでいます。大規模言語モデル（通称：LLM）は近年、非常に注目される技術となりました。ただ、7Bや13Bといった巨大モデルのパラメータは推論時間も長時間で計算時間の面からも運用が非常に難しいです。しかし、vLLMを使えば、高速化できます。本記事では、推論をどこまで高速化できるのかを検討したいと思います。 ※本記事はLLM・LLM活用のAdvent Calendar 24日目の記事です。 qiita.com vLLMとは？ vLLMによる高速化実践 vLLMを利用しない場合 vLLMを利用する vLLMに加えてAWQを利用して量子化する Auto Prefix Caching

ko-ya-ma 2024/12/24

リンク

UnityとDifyで自分専用のAIエージェントを作成する - 弁護士ドットコム株式会社 Creators’ blog

この記事は弁護士ドットコム Advent Calendar 2024の 20 日目の記事です。こんにちは。弁護士ドットコム株式会社リーガルブレイン開発室の井出です。今年も AI 絡みの話題が尽きない年となりましたが、皆さんは何が一番重要な話題だと思いましたでしょうか。それら数ある中で、私は AI エージェントの発展に注目しています。そこで趣味と勉強を兼ねて Unity と Dify とその他いろいろで自分専用の AI エージェントを作成したのでその方法をお伝えします。 AI エージェントとは今回やりたいことアプリの概要構成図完成スクリーンショット必要なもの開発環境 OpenAI API Unity Hub Unity Editor のバージョン Docker Desktop Dify ChatdollKit バージョン VRoid Studio VOICEVOX Azur

ko-ya-ma 2024/12/21

リンク

「Agentless」という最新手法。LLMの新しい使い方。

本記事では、最近流行りの「生成AIエージェント」に替わる「Agentless」（エージェントレス）という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何この記事は、ソフトウェア開発自体を自動化する際の新しい手法「Agentless」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもAIエージェントとは？」については、知っている前提で進みます。確認する場合は、こちらの記事などをご参考下さい。本題ざっくりサマリー最近、ソフトウェア開発で生成AIを使うことは当たり前になっています。（GitHub Copilot、Cursor、Devinなど、様々なツールがリリースされています。）「AGENTLESS」は、ソフトウェア開発を自動化する、という文脈でLLMを使う際の、新しい手法

ko-ya-ma 2024/12/11

リンク

Ollama で structured outputs （構造化出力）を試す｜ぬこぬこ

tl;drJSON Schema で指定したフォーマットで出力を制御可能になったよ cURL / Python / JavaScript のそれぞれで試してみたよ具体的な実用例があったのでそれも動かしてみたよ使う上での tips や今後どんな機能が追加されるかまとめたよ公開されたブログの流れに準拠しつつ、意図がズレない範囲で翻訳、解説、コードの実行をしていきます。チュートリアルになっているので、よかったら手を動かして試してみてください。 Ollama が structured outputs をサポート。JSON Schema で定義したフォーマットに LLM の出力を制御するすることが可能になりました。Ollama の Python と JavaScript のそれぞれのライブラリにおいてもサポートするよう更新。ブログでは structured outputs のユースケースとし

ko-ya-ma 2024/12/07

リンク

可愛すぎかよ! ハッカーの新しい相棒コマンドラインからLLMを使えるgptme｜shi3z

こういうのが欲しかったんだよ。マジで。コマンドラインからLLMを呼び出せるgptmeというツールがアツいこれは、gptmeコマンドを追加するというもの。環境変数としてOPENAI_API_KEYとかAnthropicのキーとかを設定しておくと勝手にAPIを呼び出してくれる。もちろん、クラウドに送信するとかけしからんという勢にはローカルLLMでも対応できる。こいつはコマンドライン版ChatGPTのようなものなので、コマンドラインで動くのだが、その真価は例えばパイプで繋いだ時とかに発揮される。 $ du -d 1|gptme "一番容量を食ってるフォルダは何Gバイト使ってんの?" Found OpenAI API key, using OpenAI provider [10:13:32] No model specified, using recommended model for

ko-ya-ma 2024/10/06

リンク

RAGは検索エンジンが命！Azure AI Search初心者入門 - Qiita

はじめにこんにちは！ AI エンジニアのヤマゾーです。近年、生成 AI の進化が目覚ましく、生成 AI を活用したシステムの開発が盛んに行われています。その中で最も有名なテクニックが RAG です。RAG というのは検索拡張生成 (Retrieval Augmented Generation) の略で、質問の関連情報を検索し、質問と関連情報をセットで入力して回答させる技術のことです。各企業ではこの RAG システムを積極的に導入していますが、ほぼ確実に課題になるのが検索部分の精度です。そして検索精度を上げるためには検索エンジンの知識が必要不可欠です。本記事では検索エンジンの筆頭サービスである Azure AI Search を題材に、検索エンジンの基本的な仕組みや検索クエリの書き方について初学者向けに解説します。サマリ本記事の目次 1. Azure AI Search の概要

ko-ya-ma 2024/09/05

リンク

GitHub - Cinnamon/kotaemon: An open-source RAG-based tool for chatting with your documents.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

ko-ya-ma 2024/09/03

“RAG UI for chatting with your documents”

リンク

GitHub - shi3z/speech-to-speech-japanese

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

ko-ya-ma 2024/08/22

リンク

はてなブックマーク

タグ

関連タグで絞り込む (88)

aiとdevに関するko-ya-maのブックマーク (88)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

月間はてなブックマーク数ランキング（2025年1月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス