タグ

検索に関するdeejayrokaのブックマーク (50)

  • RAGでも「深い検索」を実現する手法「DeepRAG」

    記事では、RAGの性能を高めるための「DeepRAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何 OpenAIがリリースした「Deep Research」[1]という機能が話題です。 この記事は、RAGでも「Deepな検索」ができるようにする手法「DeepRAG」の論文[2]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。 題 ざっくりサマリー DeepRAGは、RAGの新しい手法です。DeepRAGを使うことで、データベースを深く・網羅的に検索した上で回答するRAGを、構築することができます。中国科学院ソフトウェア研究所とWeChat AIの研究者らによって2025年2月に提案

    RAGでも「深い検索」を実現する手法「DeepRAG」
    deejayroka
    deejayroka 2025/02/12
    “LLMをファインチューニング。「こういう質問だったらWeb検索すべき/しないべき」という境界判定の精度を上げます”
  • 株式会社メルカリを退職しました - 迷わず行けよ、行けばわかるさ -

    2024-06-17 表題のとおりですが、2018-02-16 から6年3ヶ月ほど勤務した株式会社メルカリを退職することになりました。 前半3年間は機械学習エンジニア、その後は検索チームに異動して検索エンジニアとして楽しく働いていました。 メルカリは自分の社会人キャリアとして一社目の会社でしたが、得難い経験を積むことができたので、これは一生の財産。間違いない。 機械学習エンジニア時代自分が入社した 2018年2月は、メルカリでの機械学習エンジニアとしてまだ片手で数えられる規模での入社であり、他のメンバーはシニアレベルだったので、まさに情熱プログラマーの一番の下手くそでいよう 状態を地で行っていた。 機械学習チームの拡大に伴い、最初の1年ほどは全員と顔見知り、ご飯べたこともあるし、普通に喋れるという状態を維持できていたが、2年間ほどで全員の顔は把握できないレベルになり、話したことのないメン

    株式会社メルカリを退職しました - 迷わず行けよ、行けばわかるさ -
  • Amazon MemoryDBのベクトル検索機能が正式リリース。数百万のベクトル埋め込みを保存し、数ミリ秒でベクトル検索を実現

    Amazon MemoryDBのベクトル検索機能が正式リリース。数百万のベクトル埋め込みを保存し、数ミリ秒でベクトル検索を実現 機械学習や生成AIとの組み合わせにおいて、テキストや画像などを「エンベディング」(埋め込み)と呼ばれるベクトルで表現した上で、そのデータを保存し、取得、検索するなどのベクトルデータベースの機能は、いまさまざまなデータベースへの実装が進んでいます。 今回、ベクトル検索機能が正式版となったAmazon MemoryDBは、オープンソースとして実装されたインメモリのキーバリューストアであるRedis互換のインメモリデータベースです。 その名前の通りデータ操作はメモリ上で行われるため、超高速にデータの保存や読み出しが可能である点が最大の特徴です。数ミリ秒でのクエリと更新を実現します。 この高速性を活かして、大規模言語モデルにおけるRAG(Retrieval-Augment

    Amazon MemoryDBのベクトル検索機能が正式リリース。数百万のベクトル埋め込みを保存し、数ミリ秒でベクトル検索を実現
  • グーグルの生成AI検索、日本で開始 「AI Overviews」

    グーグルの生成AI検索、日本で開始 「AI Overviews」
    deejayroka
    deejayroka 2024/08/23
    “Webの検索結果を活用しながら独自の“まとめ”を自動で生成して表示するAI検索機能「AI Overviews(AIによる概要)」を日本で導入すると発表した。今後数週間で順次試験導入していく。”
  • RAGを専門用語に強くする手法「Golden-Retriever」

    株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。記事では、RAGの性能を高めるための「Golden-Retriever」という手法について、ざっくり理解します。 この記事は何 この記事は、RAGシステムを専門用語に強くするための手法「Golden-Retriever」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー Golden-Retrieverは、RAG(Retrieval Augmented Generation)を、業界特有の用語・社内用語を含むような質問に強くするための手法です。カリフォルニア大学の研究者らによって2024年8月に提案されました。 従来のRAGシステム

    RAGを専門用語に強くする手法「Golden-Retriever」
  • OpenAIのAI検索エンジン「SearchGPT」プロトタイプ登場

    OpenAIは7月25日(現地時間)、ネット上の情報にリアルタイムでアクセスするAI搭載検索エンジン「SearchGPT」を発表した。プロトタイプとして、少数のユーザーとパブリッシャーに公開する。 「何を探していますか?」と書かれたテキストボックスに質問をテキストで入力すると、AIがネット上の情報をまとめた回答を提示する。 米Googleの「AI Overview」(現在提供停止中)や米Perplexityの「Perplexity AI」と同様だ。 OpenAIが動画で示した例は、地域と期間を指定した音楽フェスの情報を求める質問で、回答は複数のフェスをリストアップしたものだ。 この回答に追加の質問として「〇〇は家族向けですか?」などと入力し、回答を得ることもできる。 OpenAIは、「Webからの最新情報に基づいて質問に迅速かつ直接的に回答し、関連するソースへの明確なリンクを提供する」と

    OpenAIのAI検索エンジン「SearchGPT」プロトタイプ登場
    deejayroka
    deejayroka 2024/07/26
    “ 米Googleの「AI Overview」(現在提供停止中)や米Perplexityの「Perplexity AI」と同様だ。 ”
  • Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンター コラム

    こんにちは、AI製品開発グループのファイサルです。 この記事では、Know Narrator Searchで使用されている文章参照手法、Retrieval-Augmented Generation(RAG)の精度向上方法について紹介します。 はじめに ChatGPTを始めとした大規模言語モデル(LLM)の登場により、AI業界、特に自然言語処理分野で多くの素晴らしい応用先が提案されるようになりました。 LLMは素晴らしい技術であることは間違いないですが、同時に幻覚(Hallucination)という問題を抱えています。 このHallucinationという問題は、LLMが事実と異なる情報をあたかも真実であるように回答するというもので、LLMの発表当初から指摘されていました。 この問題を解決するために、さまざまな手法が存在しますが、よく用いられるのが「Retrieval-Augmented G

    Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンター コラム
    deejayroka
    deejayroka 2024/06/06
    “Retrieval-Augmented Generationシステムの改善方法の紹介 ”
  • RAGの性能を高める「Self-RAG」を3分で理解する

    記事では、よく聞く「Self-RAG」についてざっくり理解します。軽めの記事です。 はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。 この記事は何 この記事は、RAGの新手法として昨年発表された「Self-RAG」の論文[1]について、日語で簡単にまとめたものです。 この論文は「CRAG」[2]など、最近出ている別のRAGアーキテクチャにも影響を与えているので、理解する価値がありそうです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー RAGの性能を高めるための新しい手法です。ワシントン大学などの研究者によって2023年10月に提案されました。Self-RAGという手法を使うメリットは、回答品質を上げられること、ハルシネーション(幻覚)を減らせるこ

    RAGの性能を高める「Self-RAG」を3分で理解する
    deejayroka
    deejayroka 2024/04/18
    “①RAGするかどうかをまず判断し②取得ドキュメントを批判的に選別するという手法「Self-RAG」を提案”
  • 半構造化データのためのRAGの概要

    前提 多くの文書には、テキスト、表、画像など、様々な種類のコンテンツが混在 このような半構造化データの解析は従来のRAGにとって困難な場合が多い 👎テキストを分割すると表が分断され、検索時にデータが破損する可能性がある。 👎表を埋め込むと、意味的類似性検索が困難になる可能性がある。 👎画像に含まれる情報は通常失われる。 手法 Unstructuredというlangchain,llamaindex外部のAPIを使い、ドキュメント(PDF等)から画像、テキスト、表を解析する。 multi-vector retrieverを使って、生の表、テキスト、(オプションで)画像を、検索用の要約とともに保存する。 選択肢(各選択肢が下画像のoptionに対応) 選択肢1: CLIPなどのマルチモーダルモデルを使い画像とテキストを埋め込み、類似性検索を使って両方を取得。生の画像とテキストチャンクをマル

    半構造化データのためのRAGの概要
  • Kaggleコンペ(LLM Science Exam)の振り返りと上位解法まとめ

    コンペURL どんなコンペ? LLM(ChatGPT)が作った科学・技術・工学・数学分野の問題をKaggle notebookという限られた環境下(主にメモリ13GBと9時間以内に完了)でどのくらいの精度で解けますか?という自然言語処理系のコンペ。 以下に入出力例を示しています。 ・入力 (質問)バタフライエフェクトとは何ですか? (A)バタフライ効果とは、巨大な球体が不安定な平衡点から... (B)バタフライ効果は、古典物理学における必要条件... (C)バタフライ効果は、古典物理学における物理現象の... (D)バタフライ効果とは、巨大な球体が不安定な平衡点から.... (E)バタフライ効果は、物理学における因果関係の概念の適用と.... ・出力 E A B (解答を可能性の高い順番に出力) 評価指標はMAP@3(Mean Average Precision)でした。 ベースライン解法

    Kaggleコンペ(LLM Science Exam)の振り返りと上位解法まとめ
  • Perplexityとは?使い方は?試して分かった「グーグル対抗」の検索エンジンの実力

    絶対王者グーグルの支配が続く検索エンジン市場だが、生成AIの登場で大きな変化を伴うことになりそうだ。ガートナーが2月19日に発表した予測によれば、2026年までに検索エンジンのボリュームは25%も減少するという。こうした中でグーグルへの挑戦を明言しているスタートアップ企業が「Perplexity(パープレキシティ、略称パープレ)」だ。Perplexityとは、AI チャットボットを活用した調査および会話型検索エンジン。同社にはNVIDIA、ジェフ・ベゾス氏、YouTubeの元CEOなど大物も出資ラウンドに参加しており、検索市場を攻めるマイクロソフトとも戦っていくことになる。果たしてその実力とポテンシャルとはいかなるものか。実際にPerplexityグーグルChatGPTの3つのサービスを試して結果を比較した。 バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経

    Perplexityとは?使い方は?試して分かった「グーグル対抗」の検索エンジンの実力
    deejayroka
    deejayroka 2024/03/05
    “Perplexityが提供するのはチャット形式でさまざまな情報を検索できる大規模言語モデルをベースとする「回答エンジン」だ”
  • 我々の愛したGoogle検索はすでに死んでいる - novtanの日常

    Google検索終わってしまったの?という話で界隈が少し盛り上がっていてうーんはてなってなっていてそこはかとなく嬉しい。 goldhead.hatenablog.com orangestar2.hatenadiary.com 件については僕も定期的に何かを言っている話ではあるんだけど、特にここ最近でキャッシュの検索もしなくなったってところが非常に象徴的だなあと思っています。キャッシュすることが著作権上問題だ何だで揉めたのが懐かしいよね。令和に至ってはウェブコンテンツの揮発性のほうがもはや問題である、と。 (個人的には依然として「なくなる権利」の方が重要と思っているだけど) 黄金頭さんが書いている「個人の日記が引っかからない」というのはもうずっと前から同感で、何かを見たことを共有したくて感想を探したところで例えば映画なら映画のあらすじサイトばかり引っかかる。体裁としては個人だけど明らかに広

    我々の愛したGoogle検索はすでに死んでいる - novtanの日常
    deejayroka
    deejayroka 2024/02/16
    “少なくともGoogle検索というサイトは何かを発見するための仕組みではすでになくなってしまった、という評価をせざるを得ないかなと思いますね”
  • RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO

    はじめに 新規事業部 生成AIチーム 山です。 ChatGPTOpenAI API)をはじめとしたAIの言語モデル(Large Language Model:以下、LLM)を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。 この問題を解決する方法として、Retrieval Augmented Generation(以下、RAG)という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい

    RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
  • ChatGPT Slackボットのベストユースケース - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 去年度までS高等学校の校長をやっていたsifueといいます。現在はZEN大学(仮称・設置認可申請中)の教員予定者として設立準備などを行なっており、特に自分は情報系カリキュラムやクリエイティブ系カリキュラムの設計などを担当をしています。N高/S高と同じようにテクノロジーを駆使した多様性のある就職につながる新たな学びを設計できればと思っています。 このN/S高のアドベントカレンダーも2016年から8年目に突入して、非常に感慨深いななどと思っているわけなんですが、記事では、自分が開発した、N/S高Slackや学園の教職員Slack

    ChatGPT Slackボットのベストユースケース - Qiita
  • LLMのRAG(外部知識検索による強化)をまとめた調査報告 | AIDB

    LLMのRAG(外部知識検索による強化)についての調査結果が報告されています。 基フレームワークと各構成要素の詳細、評価、そして今後の発展について言及されており網羅的です。 記事では、その報告内容を抜粋してお届けします。 【告知】AIDB HRの人材側登録者全員に対し、業界研究の手間を削減できるように「AI事業を行う企業リスト」を配布します。無料登録後すぐに閲覧とダウンロードが可能です。▼ 参照論文情報 タイトル:Retrieval-Augmented Generation for Large Language Models: A Survey 著者:Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi Bi, Yi Dai, Jiawei Sun, Haofen Wang 所属:Tongji Univers

    LLMのRAG(外部知識検索による強化)をまとめた調査報告 | AIDB
  • LangChainを使ってHyDEによるクエリ変換の効果を検証する - Ahogrammer

    ChatGPTやGPT-4をはじめとする大規模言語モデルの能力が向上し、多くの注目を集めています。とくにRAG(Retrieval Augmented Generation)と呼ばれる手法を使って、手元のデータを生成時に活用する手法がよく使われていますが、その性能を改善する方法は様々あります。その中でも、この記事ではRAG内部の検索性能を改善するためのクエリ変換に着目し、HyDEと呼ばれる手法の効果を日語の検索用データセットを使って検証した結果を示します。 記事の構成は以下のとおりです。 HyDEとは 実験設定 実験結果 実装の詳細 参考資料 HyDEとは HyDE(Hypothetical Document Embeddings:仮の文書の埋め込み)は、入力されたクエリに対して仮の文書を生成し、その文書を埋め込み、検索に使用する手法です[1]。典型的な文書検索では、ユーザーが入力したク

    LangChainを使ってHyDEによるクエリ変換の効果を検証する - Ahogrammer
  • LangChain への OpenAIのRAG戦略の適用|npaka

    以下の記事が面白かったので、かるくまとめました。 ・Applying OpenAI's RAG Strategies 1. はじめに「Open AI」はデモデーで一連のRAG実験を報告しました。評価指標はアプリケーションによって異なりますが、何が機能し、何が機能しなかったかを確認するのは興味深いことです。以下では、各手法を説明し、それぞれを自分で実装する方法を示します。アプリケーションでのこれらの方法を理解する能力は非常に重要です。問題が異なれば異なる検索手法が必要となるため、「万能の」解決策は存在しません。 2. RAG スタックにどのように適合するかまず、各手法をいくつかの「RAGカテゴリ」に分類します。以下は、カテゴリ内の各RAG実験を示し、RAGスタックに配置する図です。 3. ベースライン距離ベースのベクトルデータベース検索は、クエリを高次元空間に埋め込み(表現)し、「距離」に基

    LangChain への OpenAIのRAG戦略の適用|npaka
  • RAGにおけるドキュメント検索精度向上について(概要編)

    はじめまして。損害保険ジャパン株式会社 DX推進部の眞方です。普段はリードエンジニアとして、新しいサービスのアーキテクチャ検討からローンチまでの作業や、新規技術を用いたアプリのプロトタイプ実装などを行なっています。 弊社では、LLM(Large Language Models)を活用したアプリケーションの開発を積極的に検討し、既に社内でいくつかのプロトタイプをローンチしています。 記事では、その最も一般的?なユースケースの一つとも言えるRAG(Retrieval Augmented Generative)の構築において、ドキュメント検索精度の向上にどのように取り組んだ内容の概要を紹介させていただきます。実際の詳細な手法および結果については、別記事(実践編)で解説予定です。 はじめに RAGとは? この記事を読まれている方の中にはご存知の方も多いでしょうが、RAGとはRetrieval A

    RAGにおけるドキュメント検索精度向上について(概要編)
    deejayroka
    deejayroka 2023/11/12
    “中には表が入れ子構造になっているものや、矢羽で表現されている図等がありテキスト化に非常に苦労しました。”
  • Demo or Die(SI現場でいろいろ作った話) - Fujitsu Advent Calendar 2016 13日目 - やまぐ雑記。

    Fujitsu Advent Calendar 2016 13日目の記事です。 ワクワクする夢の技術ではなく、ドロドロした現実の現場での話。 Demo or Die Demo or Die ―デモを見せられないアイディアは、死んでいるのと同じ。 MITって大学のメディアラボのスローガンだ。うちの研究室はこの文化でやってるよ。 大学教授の言葉がずっと印象に残っています。動かさなければ意味は無い、と。 小学生の頃からプログラミングが楽しくて、社会に出てもその道で人を幸せにしたいと考えていました。 入社して 配属、そして疑問 いわゆる"客先常駐型"の、開発プロジェクトごとに人が集まる現場に配属。 言語はJava、人数は約60人。既に稼働し、改修や保守を行うフェーズでした。 たくさんの人の役に立てるシステムに携われるんだ、とワクワクしていました。 ほどなくして、不思議に思うことが出てきます。 配属

    Demo or Die(SI現場でいろいろ作った話) - Fujitsu Advent Calendar 2016 13日目 - やまぐ雑記。
  • Slack Botによるヘルプページの情報参照:LLMを組み合わせたRAGの実装

    はじめに 株式会社スマートショッピングで SRE をしているbiosugar0です。 先日、2023 年 10 月 23 日に行われた Amazon Bedrock Prototyping Camp というイベントに参加してきました。 そこでは Bedrock の紹介から始まり、Claude のハンズオン、実際にプロダクト反映を目指したプロトタイピングを行うという内容でした。 今回はその中で検証、実装した社内用の Slack bot に弊社ヘルプページを参照させる事例を紹介します。 Retrieval Augmented Generation (RAG) Retrieval Augmented Generation (RAG)は、LLM を用いた処理において、外部のデータベースや文書と連携してより精度の高い回答を生成するためのテクニックです。 GPT-4 のような LLM は、学習に使用さ

    Slack Botによるヘルプページの情報参照:LLMを組み合わせたRAGの実装