ブックマーク / zenn.dev/kun432 (3)

  • ベクトルデータベース「Weaviate」を試す 1:Quickstart

    ハイブリッド検索ができるということで、以前少し触ってみてそれからあまり触ってなかったWeaviateについて改めてやり直してみる。 やり直すきっかけになったのはこれ。 上記の記事にもあるように、Weaviateはベクトル検索・キーワード検索のハイブリッド検索ができる。ただし、日語のキーワード検索の場合にはトークナイザーがそれに対応している必要があるのだけど、ここが以前は対応していなかった。(Weaviateで日語ハイブリッド検索、みたいな記事がQiitaあたりにすでにあるけど、多分正しくトークン化されていないのでは?と思っている。) で、たまたまGitHubのレポジトリを見ていたら、どうやら以下のPRで日語トークナイザーに対応したらしい。 また、これ以外にもWeaviateにはいろいろ便利な機能があって、かなり柔軟に使えそうな気がしているので(ただその分、他のベクトルDBに比べると最

    ベクトルデータベース「Weaviate」を試す 1:Quickstart
  • オープンソースのRAGアプリ「RAGFlow」を試す

    かなり新し目のフレームワークRAGプラットフォームアプリ RAGFlowとは? RAGFlowは、深い文書理解に基づいたオープンソースのRAG(Retrieval-Augmented Generation)エンジンである。LLM(大規模言語モデル)を組み合わせることで、様々な複雑なフォーマットのデータから根拠のある引用に裏打ちされた、真実味のある質問応答機能を提供し、あらゆる規模のビジネスに合理化されたRAGワークフローを提供する。

    オープンソースのRAGアプリ「RAGFlow」を試す
  • (日本語訳) Vector databases (Part 2): Understanding their internals

    語訳: ベクトルデータベース(パート2): 内部を理解する 訳者前書き ベクトルデータベースについていろいろと調査・検証していたところ、以下の記事を見つけて、内容が非常によくまとまっており、多くの人にとっても有用な記事ではないか感じました。もはや翻訳などはDeepLChatGPTで簡単にできる時代になりつつありますが、まだまだ検索エンジンで検索されることも多いと思いますし、少しでも参照しやすくなればと考えて、作者であるPrashanth Rao氏に許可を頂いた上で日語に翻訳したものとなっています。 全4回の記事の第2回目となります。 元記事 Prashanth Rao氏のGitHubアカウント Prashanth Rao氏のTwitterアカウント 第1回目の日語訳はこちら 背景 この記事はベクトルデータベースに関するシリーズの第2回目である。このシリーズの第1回目(元記事/日

    (日本語訳) Vector databases (Part 2): Understanding their internals
  • 1