並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 807件

新着順 人気順

searchの検索結果241 - 280 件 / 807件

  • ナレッジグラフを用いたRAGの改善 - Ahogrammer

    RAG(Retrieval Augmented Generation)は大規模言語モデル(LLM)の性能を改善するための手法の1つであり、質問に対する回答を生成する際に、外部知識源から情報を取り込みます。 これにより、LLM 自体で学習できる情報量に制限されることなく、より正確で詳細な回答を生成することができます。 よく使われているRAGでは、外部知識源として検索エンジンにテキストをインデックスしておき、質問に関連するテキストをベクトル検索や全文検索を用いて取得します。しかし、構造化データを扱うことには苦労するため、質問によっては回答が不十分、あるいはまったく回答できないことに繋がります。 これらの問題を克服するために、ナレッジグラフを用いたRAGが構築されることがあります。ナレッジグラフでは、エンティティとその間の関係がグラフ構造で表現されており、単純な検索を用いた場合には回答できないよ

      ナレッジグラフを用いたRAGの改善 - Ahogrammer
    • DMCAを悪用するため65個のGoogleアカウントを駆使し約62万件のURLに削除要求を申請して検索結果から消し去った22名をGoogleが提訴

      Googleが、DMCA(デジタルミレニアム著作権法)を悪用してライバルのウェブサイトをGoogleの検索結果から削除させたとして、計22名をカリフォルニア州北部地区連邦地方裁判所に提訴しました。被告らは少なくとも65個のGoogleアカウントを作成し、11万7000件以上のウェブサイトのURLに対してDMCA違反による削除要求を行っていました。 2023.11.13 Google complaint for filing (PDFファイル)https://storage.courtlistener.com/recap/gov.uscourts.cand.420782/gov.uscourts.cand.420782.1.0.pdf Google sues people who “weaponized” DMCA to remove rivals’ search results | Ars

        DMCAを悪用するため65個のGoogleアカウントを駆使し約62万件のURLに削除要求を申請して検索結果から消し去った22名をGoogleが提訴
      • 意味的知識グラフとApache Solrを使った関連語検索の実装 - Ahogrammer

        Manningから出版予定の『AI-Powered Search』(AIを活用した情報検索の意)を冬休み中に読んでいたら、その中で意味的知識グラフ(Semantic Knowledge Graph)と呼ばれるデータ構造について説明していて、関連語の計算やクエリ拡張などに使えるということで興味深かったので紹介しようと思います。最初に意味的知識グラフについて説明したあと、日本語のデータセットに対して試してみます。 AI-Powered Search(https://www.manning.com/books/ai-powered-search) 本記事の構成は以下のとおりです。 意味的知識グラフとは 意味的知識グラフを用いた関連語の計算 参考資料 意味的知識グラフとは 知識グラフと聞くと、固有表現認識や関係抽出、OpenIEを使って構築するグラフを思い浮かべる方もいると思うのですが、意味的知識

          意味的知識グラフとApache Solrを使った関連語検索の実装 - Ahogrammer
        • 末期がんの夫がすがった145万円ワクチン 「効果ない治療だった」:朝日新聞デジタル

          ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

            末期がんの夫がすがった145万円ワクチン 「効果ない治療だった」:朝日新聞デジタル
          • オープンソースのRAG UI「kotaemon」を試す

            2024/09/03追記 ちょっとX経由で見に来ていただいた方が増えているようなのであらかじめ注意。 kotaemonで普通のRAGをやる場合は、OpenAI/Ollamaどちらの場合でも多分問題なくできるんじゃないかと思います。 kotaemonでGraphRAGをやる場合(多分ここに期待している人が多いと推測)は、以下の注意が必要です。 OpenAIならGraphRAGが動作しますが、モデルがgpt-4-turbo限定になると思います、つまりコストが高いです OllamaでGraphRAGは現状の実装だとちょっと難しそうです 公式にIssue上げてます(どっちかというとGraphRAG側の問題かなと思います)ので、kotaemonのGraphRAG対応については今後のリリースに期待するほうが良いかなと個人的には思います。 ここで知った。 GitHubレポジトリ kotaemon ドキュ

              オープンソースのRAG UI「kotaemon」を試す
            • LangChain への OpenAIのRAG戦略の適用|npaka

              以下の記事が面白かったので、かるくまとめました。 ・Applying OpenAI's RAG Strategies 1. はじめに「Open AI」はデモデーで一連のRAG実験を報告しました。評価指標はアプリケーションによって異なりますが、何が機能し、何が機能しなかったかを確認するのは興味深いことです。以下では、各手法を説明し、それぞれを自分で実装する方法を示します。アプリケーションでのこれらの方法を理解する能力は非常に重要です。問題が異なれば異なる検索手法が必要となるため、「万能の」解決策は存在しません。 2. RAG スタックにどのように適合するかまず、各手法をいくつかの「RAGカテゴリ」に分類します。以下は、カテゴリ内の各RAG実験を示し、RAGスタックに配置する図です。 3. ベースライン距離ベースのベクトルデータベース検索は、クエリを高次元空間に埋め込み(表現)し、「距離」に基

                LangChain への OpenAIのRAG戦略の適用|npaka
              • RAGの新しい手法「CRAG」を3分で理解する

                本記事では、最近よく聞くようになった「CRAG」についてざっくり理解します。軽めの記事です。 はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。 この記事は何 この記事は、RAGの新手法として最近注目されている「Corrective Retrieval Augmented Generation (CRAG)」の論文[1]について、日本語で簡単にまとめたものです。 「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 本題 ざっくりサマリー RAGの性能を高めるための新しい手法です。Googleなどの研究者によって2024年2月に提案されました。CRAG(日本語にすると「修正型検索拡張生成」)という手法を使うメリットは、ハルシネーション(幻覚)を減らせることです。CRAGが従来の「RAG」より

                  RAGの新しい手法「CRAG」を3分で理解する
                • Windows11のすべてを保存する「Recall」機能の記録データからあらゆるものを抽出する「TotalRecall(トータル・リコール)」

                  Microsoftは、AI特化のWindows PC「Copilot+ PC」で、PC上の作業や視聴履歴をすべて記録して検索できる機能「Recall」を発表しました。この「Recall」がノートPCに記録するすべての情報を自動的に抽出して表示するデモツール「TotalRecall」を、セキュリティ研究者でホワイトハッカーでもあるアレックス・ハーゲナ氏がリリースしました。 GitHub - xaitax/TotalRecall: This tool extracts and displays data from the Recall feature in Windows 11, providing an easy way to access information about your PC's activity snapshots. https://github.com/xaitax/To

                    Windows11のすべてを保存する「Recall」機能の記録データからあらゆるものを抽出する「TotalRecall(トータル・リコール)」
                  • 家の中にあるいろいろなモノを記録し在庫・位置・保証期限などを管理・検索しやすくしてくれる「Homebox」レビュー

                    家の中に色んな製品があってそのすべてを記録したい、というときに使えるサービスが「Homebox」です。GIGAZINE編集部にはスマートフォンやカメラなど多種多様な製品が100種類以上あり、その製品名やシリアル番号、保管場所、さらには保証期限など製品に関するあらゆる情報を記録しているのですが、それぞれの情報を一目見ただけで把握でき、検索などをスムーズに行えるようなしっくりくる記録方法を見つけられていませんでした。そんなときに発見したのが無料で使えてシリアル番号や保管場所などを製品ごとに記録できるHomebox。このサービスを使って色んな製品を記録・管理してみました。 GitHub - hay-kot/homebox: Homebox is the inventory and organization system built for the Home User https://github

                      家の中にあるいろいろなモノを記録し在庫・位置・保証期限などを管理・検索しやすくしてくれる「Homebox」レビュー
                    • Google検索のアルゴリズム変更でトラフィックの90%超を失ったウェブサイトが窮状を訴える

                      空気清浄機のテストやレビューを行う独立系メディアのHouseFreshが、「Google検索の検索結果ページから、HouseFreshが事実上消えてしまった」と報告しています。 HouseFresh disappeared from Google Search results. Now what? https://housefresh.com/how-google-decimated-housefresh/ 2024年2月、HouseFreshは「Google検索の検索結果上位に表示される有名メディアの商品レビュー記事を信用しないように」という警告記事を公開しました。この記事が公開されてから10週間以上が経過してからも、ソーシャルメディア経由で多くの反響メッセージが届くそうです。 問題の記事を公開してから数日後、HouseFreshはデジタルメディア・Dotdash Meredithの元従

                        Google検索のアルゴリズム変更でトラフィックの90%超を失ったウェブサイトが窮状を訴える
                      • Googleを独占禁止法違反で審査 公正取引委員会、検索寡占解明へ - 日本経済新聞

                        スマートフォン端末の初期設定でスマホメーカーに対し、自社の検索サービスを不当に優遇させるなどした疑いがあったとして、公正取引委員会は23日、米グーグルに対して独占禁止法違反の疑いで審査を開始したと発表した。あわせて第三者からの意見募集も始めた。同社が圧倒的なシェアを持つ検索サービスなどを巡っては欧米当局が規制を強化している。海外と歩調を合わせ、日本市場でも各社間の競争が阻害されていないか実態解

                          Googleを独占禁止法違反で審査 公正取引委員会、検索寡占解明へ - 日本経済新聞
                        • 女性飛行士イアハートの搭乗機発見か 米深海探査会社

                          太平洋の海底約4875メートルの地点に横たわる、米国の女性飛行士、アメリア・イアハートの搭乗機とみられる飛行機状の物体のソナー映像。ディープ・シー・ビジョン社提供(2024年1月29日提供)。(c)AFP PHOTO / HANDOUT / Deep Sea Vision 【1月30日 AFP】(写真追加)世界一周飛行中の1937年に太平洋上で消息を絶った米国の女性飛行士、アメリア・イアハート(Amelia Earhart)の搭乗機の残骸とみられるものが見つかった。深海探査を専門とする企業が、ソナー映像を公開した。 イアハート機の可能性があるものを発見したのはサウスカロライナ州を本拠とするディープ・シー・ビジョン(DSV)。イアハートが目指していた太平洋の孤島ハウランド(Howland)島西方の水深約5000メートルの地点で、無人潜水艇にえい航された、海底面を画像化する「サイドスキャンソナ

                            女性飛行士イアハートの搭乗機発見か 米深海探査会社
                          • ニュース配信 記事使用料 著しい低単価は独禁法違反のおそれも | NHK

                            公正取引委員会は、新聞社などのメディアと、ヤフーなどニュースを扱うポータルサイトやアプリの運営事業者との取り引き実態に関する調査をまとめました。運営事業者によって記事の使用料の単価は5倍程度の開きがあり、一方的に著しく低い単価を設定した場合は、独占禁止法違反のおそれがあると指摘しています。 新聞やテレビ、雑誌などのメディアの記事は、ニュースを扱うポータルサイトやアプリでも見ることができますが、その使用料などをめぐって、メディアから不満の声も上がっていることから、公正取引委員会がこのほど取り引きの実態を調査し、報告書にまとめました。 それによりますと、運営事業者が2021年度、支払った記事の平均の使用料は、閲覧回数1000回当たりで ▽最も高い事業者で251円 ▽最も低い事業者で49円と 事業者によって5倍程度の開きがあったということです。 また、メディアと運営事業者の関係について ▽およそ

                              ニュース配信 記事使用料 著しい低単価は独禁法違反のおそれも | NHK
                            • 今まで名前知らんくてこう調べるしかなかった、ありがとう神様→これがバズってから検索数爆上がりで草

                              雲外昇天 @ijigenrounin @rainorimen ドルフィンパンツ、いいですよね ラフでありつつも計算し尽くされたその切れ込みが、太ももの魅力を最大限に引き立てて、ルーズな裾が、私たちの“見えそうでみえないもどかしさ”をくすぐる,,,嗚呼、これは芸術的にも至高の領域に達していると言っても過言ではない,,,

                                今まで名前知らんくてこう調べるしかなかった、ありがとう神様→これがバズってから検索数爆上がりで草
                              • RAGに質問分類させる「Adaptive-RAG」の解説

                                本記事では、「Adaptive-RAG」についてざっくり理解します。軽めの記事です。 株式会社ナレッジセンスでは普段の業務で、生成AIやRAGシステムを活用したサービスを開発しています。 この記事は何 この記事は、Adaptive系で現在、最も「コスパ」が良いとされる「Adaptive-RAG」の論文[1]について、日本語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 本題 ざっくりサマリー RAGの回答精度を高めるための手法です。韓国科学技術院(KAIST)の研究者らによって2024年3月に提案されました。「Adaptive-RAG」という手法を使うメリットは、ユーザーからの入力としてシンプルな質問・複雑な質問、どちらも想定される場合に、「そこまで遅くなりすぎずに、ある程度の回答精度がでる」という点

                                  RAGに質問分類させる「Adaptive-RAG」の解説
                                • モダンなエクスプローラー代替「Files」がファイル検索ツール「Listary」とタッグ/[Ctrl]キー2回で呼び出し、OSのファイルダイアログも使いやすく

                                    モダンなエクスプローラー代替「Files」がファイル検索ツール「Listary」とタッグ/[Ctrl]キー2回で呼び出し、OSのファイルダイアログも使いやすく
                                  • 「Google 検索」に「Wayback Machine」リンク、過去ページへ直接アクセスできるように/検索キャッシュへのリンクがなくなっても、もう大丈夫?

                                      「Google 検索」に「Wayback Machine」リンク、過去ページへ直接アクセスできるように/検索キャッシュへのリンクがなくなっても、もう大丈夫?
                                    • 検索ボリュームではなく、「検索ジャーニー」でコンテンツを考える方法 - ブログ - 株式会社JADE

                                      こんにちは!JADEの垣本です。 最近一気読みしたマンガは『ダンジョン飯』、今いちばん続きが気になるマンガは『忍者と極道』です。 前回の記事「私がSEOのコンテンツプランニングで大切にしていること」では、「コンテンツを作るときに考えるべきことは?」という話を書きました。今回は、その手前の段階である「そもそもどんなコンテンツが必要?」という点を掘り下げたいと思います。 特に「検索クエリってどうやって洗い出すの?」「検索クエリをピックアップしてみたけど、優先順位の付け方が分からない……」という悩みをお持ちの方へ。私なりの回答をご提案します。 ※前回の記事に引き続き、当記事におけるコンテンツは、自然検索流入を増やすことをKPIとしたものを念頭に置いています。 よくある質問「月5本の記事を作りたいのですが、何から着手すべきですか?」 よくある質問への答え「検索ジャーニーから考えましょう」 実践:し

                                        検索ボリュームではなく、「検索ジャーニー」でコンテンツを考える方法 - ブログ - 株式会社JADE
                                      • 医療のマスターDBを爆速で検索するWebサービスを爆速で作った

                                        ヘンリーの Lead Architect の kohii です。 先日、医療系の個人開発サービス MediXplorer を作ったので、簡単なサービス紹介と技術的に工夫したこととかについて書きます。 作ったもの MediXplorer は厚労省(もしくは社会保険診療報酬支払基金)から提供される 医科診療行為マスター を検索・閲覧するためのWebアプリケーションです。 医科診療行為マスターって? 日本には診療報酬制度というものがあり、病院等が医療サービスを提供した際の医療費の計算ルールが定められています。このシステムのもと、医療機関は提供した医療行為ごとに決められた点数に基づき医療費を計算し、患者や保険組合に請求します。(初診料 = 288点 みたいなやつ。1点10円で、通常そのうちの3割を会計時に支払う。) 「医科診療行為マスター」は、これらの医療行為のデータベースの一つで、列数150、行

                                          医療のマスターDBを爆速で検索するWebサービスを爆速で作った
                                        • AzureでRAGをガンガン試行錯誤してみて得たナレッジを紹介します!/Azure RAG knowledge share

                                          2024/1/31に開催された【StudyCo×KAGコラボ】Azure・AWSでLLMアプリ開発レベルアップ!事例&ハンズオンで発表した資料です。 AzureでRAGによる社内文章検索をやってみてさまざまな試行錯誤を通して得たナレッジを共有します!

                                            AzureでRAGをガンガン試行錯誤してみて得たナレッジを紹介します!/Azure RAG knowledge share
                                          • Google検索、スパム・低品質サイトを4割削減へ

                                              Google検索、スパム・低品質サイトを4割削減へ
                                            • Googleの検索アルゴリズムに関する内部文書が流出、Chromeのデータをページランク付けに利用するなどGoogleのウソが明らかに

                                              Googleの社員がデータやAPI、モジュールの扱いに習熟するのに用いられているという、合計2500ページ超の内部文書「Google API Content Warehouse」が流出しました。これにより、Googleが検索ユーザーの情報やChromeのデータなどをどのようにして利用していたのかといった実態が明らかになりました。内容を精査したSEO(検索エンジン最適化)業界の関係者は、含まれている情報はほとんどが2024年3月時点のかなり新しいものであるとしています。 An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them - SparkToro https://sparktoro.com/blog/an-anony

                                                Googleの検索アルゴリズムに関する内部文書が流出、Chromeのデータをページランク付けに利用するなどGoogleのウソが明らかに
                                              • Spotifyのプロダクト戦略をUIの変化から読み解く|鈴木慎吾 / TSUMIKI INC.

                                                Spotifyのタブバー、いままで5つだったタブが3つになってた。消えたのはBrowseとRadio。BrowseはSearchに統合され、Radioの機能はたぶん消えた。こういうアップデートって勇気がいるが、結果使いやすくなったと思う。 pic.twitter.com/vf1ncj0qjh — 鈴木慎吾 / TSUMIKI INC. (@shingo2000) October 19, 2018 長く使われ続けているサービスでは、新しい機能がどんどん追加されていきます。新しいユーザーを増やしたり、現在のユーザーを引きつけ続けることが主な理由で、Spotifyにも様々な機能が追加されています。それにも関わらず主要なナビゲーションのタブを減らすのは勇気のいる選択だと思いました。プロダクト開発に関わっていると実感しますが、何かを付け加えることよりも何かを削ることのほうがずっと難しいのです。このU

                                                  Spotifyのプロダクト戦略をUIの変化から読み解く|鈴木慎吾 / TSUMIKI INC.
                                                • いまGoogleを使ってない人は、何を使っているのか?

                                                  『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

                                                    いまGoogleを使ってない人は、何を使っているのか?
                                                  • Bard が高性能なモデルにアップデート

                                                    生成 AI を身近に体験いただける Bard の最大の利点のひとつは、ユーザーのニーズに合わせた回答を提供できることです。たとえば、旅行の計画を作成してもらったり、メールの文章を作成してもらったり、子供たちに科学の問題を説明するのを手伝ってもらったりすることができます。さらに、今回のアップデートにより、アイデアをより簡単に実現できるように、Bard の回答のカスタマイズが更に向上しました。本日より、Bard の高性能なモデルを公開します。これまで英語で提供してきた機能をより多くの言語や国に拡大するほか、より役立つ回答を提供できるよう、Bard を Google のアプリやサービスと統合します(英語のみ対応)。また、「Google で検索」機能を改善し、回答をダブルチェックできるようにしました。 複数機能を多言語・多地域で Google は責任を持って Bard の開発を続けており、これまで

                                                      Bard が高性能なモデルにアップデート
                                                    • 10X の推薦を作るチームと ML platform - 10X Product Blog

                                                      10X ソフトウェアエンジニアの @metalunk です。ネットスーパー、ネットドラッグストアのプラットフォームである Stailer 事業で、機械学習(ML)と検索を専門として働いています。 2024年4月からいま(2024年8月)までの5ヶ月間で6つの推薦機能をリリースできました。この成果を支えたのはチームと ML platform(機械学習の基盤システム)です。このブログではチームの取り組み、ML platform の機能、および具体的な成果についてご紹介します。 このブログは技術ブログの体ではありますが、さまざまな業界、職種の方に読んでいただくことを目指して執筆しました。 (3) 章, (5) 章だけは機械学習に取り組んでいる人向けの内容を含みますので興味のない方は読み飛ばしてもらって結構です(機械学習に取り組んでいなくても興味のある方はぜひ読んでください)が、それ以外は IT

                                                        10X の推薦を作るチームと ML platform - 10X Product Blog
                                                      • 性欲がまったく無いと思って性欲のツボ調べて押したら普通に性欲が強くなって自分の体が単純で怖いです→「ツボって効果あるんだ」

                                                        あさの @asano4124 @trailteamoomoto 精力 ツボ とかで検索すれば色々出ると思います。一箇所よりも複数押した方が血流が良くなるのでいいと思います

                                                          性欲がまったく無いと思って性欲のツボ調べて押したら普通に性欲が強くなって自分の体が単純で怖いです→「ツボって効果あるんだ」
                                                        • Doing RAG? Vector search is *not* enough

                                                          I'm concerned by the number of times I've heard, "oh, we can do RAG with retriever X, here's the vector search query." Yes, your retriever for a RAG flow should definitely support vector search, since that will let you find documents with similar semantics to a user's query, but vector search is not enough. Your retriever should support a full hybrid search, meaning that it can perform both a vect

                                                            Doing RAG? Vector search is *not* enough
                                                          • Windows PC画面を常時記録・AIで全検索できる『Recall』(回顧)機能、マイクロソフトが発表。『Copilot+ PC』向け | テクノエッジ TechnoEdge

                                                            Recallは、かつてWindows 10に搭載されていた『タイムライン』の拡張版といった機能。アクティブな画面のスナップショットを数秒ごとに常時取得し、スライダーで遡ったり、Copilotを通じて内容を検索できる機能です。 記録したスナップショットはCopilot によるAI検索が可能。たとえば数日前にWEBで検索して見たページが思い出せないような場合、覚えている要素、たとえば「赤い車」や「白いスニーカー」などと検索すると、撮影されたスナップショットの中から該当するものを見つけてくれます。 単に過去の画像を表示するだけではなく、その時に使用していたアプリを開くこともできるようになるとのことです。 (▲画像:Recall機能のデモ。スライダーで過去に遡って画面を見られる) スナップショットはPCのローカルストレージ内に保存し、デバイス上の暗号化とBitLockerで保護します。特定のユーザ

                                                              Windows PC画面を常時記録・AIで全検索できる『Recall』(回顧)機能、マイクロソフトが発表。『Copilot+ PC』向け | テクノエッジ TechnoEdge
                                                            • 2023 年 Google 検索ランキングを発表

                                                              メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                                                                2023 年 Google 検索ランキングを発表
                                                              • Perplexityが「Pages」を発表 - 最強のAI記事ジェネレーター | AI専門ニュースメディア AINOW

                                                                ソフトウェアエンジニア兼イラストレーターで、AI専門メディアGenerative AIとZeniteqを運営するジム・クライブ・モンジュ(Jim Clyde Monge)氏(詳細は同氏のLinkedInページを参照)がMediumに投稿した記事『Perplexityが「Pages」を発表 – 最強のAI記事ジェネレーター』では、検索AIのPerplexityの新機能であるPerplexity Pagesが紹介されています。 Perplexity Pagesの特徴を箇条書きにすると、以下のようになります。 Perplexity Pagesの特徴 Perplexity Pagesとは、特定のトピックについてPerplexityが検索して生成した文章をウェブ記事化するサービス。 Perplexity Pagesで生成された記事は、ウィキペディアのような簡潔なレイアウトをしている。 対象読者を「誰

                                                                  Perplexityが「Pages」を発表 - 最強のAI記事ジェネレーター | AI専門ニュースメディア AINOW
                                                                • 近似最近傍探索ライブラリVoyagerで類似単語検索を試す

                                                                  本記事について 2023年10月にSpotifyが新たな近似最近傍探索ライブラリとして「Voyager」を発表した[1]。本記事ではVoyagerについて調べたことや、単語の類似検索をユースケースとした実装サンプル、Annoyとの性能比較の結果を備忘としてメモしておく。 近似最近傍探索とは Voyagerの話に入る前に、近似最近傍探索について説明する。 最近傍探索 (Nearest Neighbor Search)とは、あるベクトルのクエリが与えられたときに、そのクエリと「最も似ているベクトル」をベクトルの集合から見つける技術である。 ナイーブな方法としては、クエリのベクトルと、集合の一つ一つのベクトルとの距離をコサイン類似度などで計算し、最も距離が近いものを抽出する線形探索が考えられる。しかし、このアプローチではO(N)(Nは集合のサイズ)で探索に時間がかかるため、データセットが膨大にな

                                                                    近似最近傍探索ライブラリVoyagerで類似単語検索を試す
                                                                  • キーワード探しに困ったらこれ!ブログ記事に迷ったときのポイント #キーワード #ブログ #記事 - 雨のち晴れ

                                                                    ブログを書くときにポイントとなってくるのは、読者の方がどういった内容を読みたいと思っているのかだと思います。たくさんの方が検索エンジンを通じて、ブログ記事を読みにきていただけると、それだけブログのアクセス数も増加し、ブログが育っていきます。書く内容が明確であれば、すぐに書き始めることもできるのですが、書く内容が迷ったとき、ネタが尽きてしまったときにはどうすればよいのでしょうか?そのようなときには、何かキーワードを探さなければなりません。この記事では、ブログ記事に困ったときのポイントについてお伝えします。 ブログのキーワードを選ぶ際には、検索エンジン最適化(SEO)や読者のニーズを考慮することが重要です。参考にしていただければと思います。 目標の設定 1.ブログ記事の目的明確化 2.ターゲット読者層の把握 ニッチキーワードの特定 1. テーマやジャンルの明確化 2.特化したキーワードの選定

                                                                      キーワード探しに困ったらこれ!ブログ記事に迷ったときのポイント #キーワード #ブログ #記事 - 雨のち晴れ
                                                                    • [Software Design連動企画] 実践クエリチューニング | gihyo.jp

                                                                      この記事は、『Software Design 2024年6月号』(2024年5月17日発売)の第1特集「SQLチューニングする前に知っておきたい 実行計画&インデックスのしくみ」の連動企画です。ぜひ本誌特集1もお読みください。 適切なインデックスを設計する インデックスの調整によるクエリの高速化は、RDBMSを使用する際の数あるチューニングテクニックの中でも最もお手軽なものです。テーブルのカラムの定義を変えるわけではないので、クエリの結果に違いが生じず、アプリケーションを変更する必要性がないからです。適切なインデックスを付与するだけでチューニングが済むというのは極めて効率的です。それでは適切なインデックスとはどのようなものでしょうか。本記事では、まずインデックスを設計する際に重要なポイントを解説します。 インデックスとSQL構文 「どのカラムの組み合わせに対してインデックスを作成すべきか」

                                                                        [Software Design連動企画] 実践クエリチューニング | gihyo.jp
                                                                      • 実例で理解するベクトル検索。YouTubeの関連動画検索をつくってみた

                                                                        生成AIの隆盛に伴い、ベクトル検索やベクトルデータベースが注目されています。 ベクトルについてより理解するために簡単なデモサービスを作ってみました。 この記事では作ったサービスをもとにベクトルについて説明し、後半では生成AIとベクトルの関連について紹介します。 つくったもの 「しもふりサーチ」 - お笑いコンビ「霜降り明星」のYouTubeチャンネル、「しもふりチューブ」の過去動画を検索できるサービスです。 このサービスには以下の2つの機能があります。 1. 文章での動画検索 文章で動画を検索する 「粗品さんがクイズを出題する回」 や 「せいやさんがギターを弾く回」 など、自然言語で動画を検索できます。 2. 関連動画レコメンド 内容の近い動画をレコメンドする 動画を選ぶと、過去動画の中から内容の近い動画をレコメンドします。 これらの機能はベクトル検索で実現されています。詳細を説明していき

                                                                          実例で理解するベクトル検索。YouTubeの関連動画検索をつくってみた
                                                                        • 2023 年の Bard 活用方法トップ 10を発表

                                                                          今年 5 月の日本での提供開始以来、多くのユーザーに試験運用中の会話型生成 AI サービスの Bard を使っていただいています。本日、2023 年の Bard 活用方法を発表します。このランキングでは、各活用方法における詳細や最新機能も含めた Tips に加えて英語版との比較を併せてご紹介します。このランキングが、まだ Bard を使ったことがない人や日常的には利用していない方が、Bard をどのように使えるかを知ってもらうヒントになれば幸いです。 情報収集に関する活用法が上位に日本語のランキングにおいては、調べ物や相談など情報を幅広く調べる“情報収集”に関する活用方法が多くランクインしました。 “情報収集”の中でも、1 位には 「水の沸点は、気圧によって変わりますか?」や「sin 90° = ?」など、単一・複数の明確な答えを探す「事実に関する調べもの」に関する使い方がランクインしまし

                                                                            2023 年の Bard 活用方法トップ 10を発表
                                                                          • Xを検索できる「Yahoo!リアルタイム検索」でインプレゾンビ対策

                                                                              Xを検索できる「Yahoo!リアルタイム検索」でインプレゾンビ対策
                                                                            • AIがユーザーの意図を察して補助するBing新機能「ディープ検索」が一般公開! その実力を試す【イニシャルB】

                                                                                AIがユーザーの意図を察して補助するBing新機能「ディープ検索」が一般公開! その実力を試す【イニシャルB】
                                                                              • RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A Day in the Life

                                                                                この記事は、情報検索・検索技術 Advent Calendar 2023の12月4日の記事である。 昨今のLLMの台頭により、外部情報を In-Context Learning として利用しLLMの生成結果の性能を高めることが可能な RAG(Retrieval Augmented Generation) の重要性の高まりを感じる。ただ、RAG を使ったシステムを構築してみようにも、データが少ないと面白みが少なかったりする。その為、Wikipedia 日本語の約550万文から簡単に検索可能でRAGの入力データとして使えるような embeddings と、素早い速度でベクトル検索できるような faiss 用の index を作成した。 例えば、Wikipedia から該当の文を検索する用途はこのように使える。 from datasets.download import DownloadMana

                                                                                  RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A Day in the Life
                                                                                • A search engine in 80 lines of Python

                                                                                  February 05, 2024 · 26 mins · 4727 words Discussion on HackerNews. Last September I hopped on board with Wallapop as a Search Data Scientist and since then part of my work has been working with Solr, an open-source search engine based on Lucene. I’ve got the basics of how a search engine works, but I had this itch to understand it even better. So, I rolled up my sleeves and decided to build one fr