並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 817件

新着順 人気順

検索エンジンの検索結果241 - 280 件 / 817件

  • Dify で RAG を試す|npaka

    1. RAG「RAG」(Retrieval Augmented Generation) は、最新の外部知識の習得とハルシネーションの軽減という、LLMの2つの主要課題に対処するためのフレームワークです。開発者はこの技術を利用して、AI搭載のカスタマーボット、企業知識ベース、AI検索エンジンなどをコスト効率よく構築できます。これらのシステムは、自然言語入力を通じて、さまざまな形態の組織化された知識と相互作用します。 下図では、ユーザーが「アメリカの大統領は誰ですか?」と尋ねると、システムは回答のためにLLMに質問を直接渡しません。代わりに、ユーザーの質問について、知識ベース (Wikipediaなど) でベクトル検索を実施します。意味的な類似性マッチングを通じて関連するコンテンツを見つけ (たとえば、「バイデンは現在の第46代アメリカ合衆国大統領です...」)、LLMに発見した知識とともにユ

      Dify で RAG を試す|npaka
    • Googleの検索アルゴリズムに関する内部文書が流出、Chromeのデータをページランク付けに利用するなどGoogleのウソが明らかに

      Googleの社員がデータやAPI、モジュールの扱いに習熟するのに用いられているという、合計2500ページ超の内部文書「Google API Content Warehouse」が流出しました。これにより、Googleが検索ユーザーの情報やChromeのデータなどをどのようにして利用していたのかといった実態が明らかになりました。内容を精査したSEO(検索エンジン最適化)業界の関係者は、含まれている情報はほとんどが2024年3月時点のかなり新しいものであるとしています。 An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them - SparkToro https://sparktoro.com/blog/an-anony

        Googleの検索アルゴリズムに関する内部文書が流出、Chromeのデータをページランク付けに利用するなどGoogleのウソが明らかに
      • Spotifyのプロダクト戦略をUIの変化から読み解く|鈴木慎吾 / TSUMIKI INC.

        Spotifyのタブバー、いままで5つだったタブが3つになってた。消えたのはBrowseとRadio。BrowseはSearchに統合され、Radioの機能はたぶん消えた。こういうアップデートって勇気がいるが、結果使いやすくなったと思う。 pic.twitter.com/vf1ncj0qjh — 鈴木慎吾 / TSUMIKI INC. (@shingo2000) October 19, 2018 長く使われ続けているサービスでは、新しい機能がどんどん追加されていきます。新しいユーザーを増やしたり、現在のユーザーを引きつけ続けることが主な理由で、Spotifyにも様々な機能が追加されています。それにも関わらず主要なナビゲーションのタブを減らすのは勇気のいる選択だと思いました。プロダクト開発に関わっていると実感しますが、何かを付け加えることよりも何かを削ることのほうがずっと難しいのです。このU

          Spotifyのプロダクト戦略をUIの変化から読み解く|鈴木慎吾 / TSUMIKI INC.
        • Bard が高性能なモデルにアップデート

          生成 AI を身近に体験いただける Bard の最大の利点のひとつは、ユーザーのニーズに合わせた回答を提供できることです。たとえば、旅行の計画を作成してもらったり、メールの文章を作成してもらったり、子供たちに科学の問題を説明するのを手伝ってもらったりすることができます。さらに、今回のアップデートにより、アイデアをより簡単に実現できるように、Bard の回答のカスタマイズが更に向上しました。本日より、Bard の高性能なモデルを公開します。これまで英語で提供してきた機能をより多くの言語や国に拡大するほか、より役立つ回答を提供できるよう、Bard を Google のアプリやサービスと統合します(英語のみ対応)。また、「Google で検索」機能を改善し、回答をダブルチェックできるようにしました。 複数機能を多言語・多地域で Google は責任を持って Bard の開発を続けており、これまで

            Bard が高性能なモデルにアップデート
          • いまGoogleを使ってない人は、何を使っているのか?

            『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

              いまGoogleを使ってない人は、何を使っているのか?
            • Windows PC画面を常時記録・AIで全検索できる『Recall』(回顧)機能、マイクロソフトが発表。『Copilot+ PC』向け | テクノエッジ TechnoEdge

              Recallは、かつてWindows 10に搭載されていた『タイムライン』の拡張版といった機能。アクティブな画面のスナップショットを数秒ごとに常時取得し、スライダーで遡ったり、Copilotを通じて内容を検索できる機能です。 記録したスナップショットはCopilot によるAI検索が可能。たとえば数日前にWEBで検索して見たページが思い出せないような場合、覚えている要素、たとえば「赤い車」や「白いスニーカー」などと検索すると、撮影されたスナップショットの中から該当するものを見つけてくれます。 単に過去の画像を表示するだけではなく、その時に使用していたアプリを開くこともできるようになるとのことです。 (▲画像:Recall機能のデモ。スライダーで過去に遡って画面を見られる) スナップショットはPCのローカルストレージ内に保存し、デバイス上の暗号化とBitLockerで保護します。特定のユーザ

                Windows PC画面を常時記録・AIで全検索できる『Recall』(回顧)機能、マイクロソフトが発表。『Copilot+ PC』向け | テクノエッジ TechnoEdge
              • 検索ボリュームではなく、「検索ジャーニー」でコンテンツを考える方法 - ブログ - 株式会社JADE

                こんにちは!JADEの垣本です。 最近一気読みしたマンガは『ダンジョン飯』、今いちばん続きが気になるマンガは『忍者と極道』です。 前回の記事「私がSEOのコンテンツプランニングで大切にしていること」では、「コンテンツを作るときに考えるべきことは?」という話を書きました。今回は、その手前の段階である「そもそもどんなコンテンツが必要?」という点を掘り下げたいと思います。 特に「検索クエリってどうやって洗い出すの?」「検索クエリをピックアップしてみたけど、優先順位の付け方が分からない……」という悩みをお持ちの方へ。私なりの回答をご提案します。 ※前回の記事に引き続き、当記事におけるコンテンツは、自然検索流入を増やすことをKPIとしたものを念頭に置いています。 よくある質問「月5本の記事を作りたいのですが、何から着手すべきですか?」 よくある質問への答え「検索ジャーニーから考えましょう」 実践:し

                  検索ボリュームではなく、「検索ジャーニー」でコンテンツを考える方法 - ブログ - 株式会社JADE
                • LLM開発のためにMLOpsチームがやるべきこと | フューチャー技術ブログ

                  はじめにこんにちは、SAIG/MLOpsチームでアルバイトをしている板野・平野です。 今回は「LLM開発のためにMLOpsチームがやるべきこと」というテーマで、従来のMLOpsとの違い・ツール・構成例等について調査・整理しました。 LLMとはLarge Launguage Model(大規模言語モデル)の略であり、ここでのLLM開発とは、「LLM自体の開発」および「LLMを活用したシステム開発」の両方を含むものとします。LLM開発のフローについては以前にLLM開発のフローで詳細を説明しているので、ぜひ併せてご覧ください。 まず、MLOpsとは「機械学習モデルの実装から運用までを円滑に推進するための手法や考え方」のことです。AIの社会実装が増えるに伴い、MLOpsチームを設ける企業も増えてきました。また、最近ではLLMやその関連技術が急速に発達してきており、今後LLMを用いたアプリケーション

                    LLM開発のためにMLOpsチームがやるべきこと | フューチャー技術ブログ
                  • 2023 年 Google 検索ランキングを発表

                    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                      2023 年 Google 検索ランキングを発表
                    • “Twitterキラー”スレッズ、関心はピークの50分の1 不満溢れる「X」が意外に順調なワケ

                      イーロン・マスク氏が7月に突如として行った「Twitter」から「X」への名称変更は世間を騒がせた。これに先立って始まったツイートの閲覧制限もあり、愛想を尽かしたTwitterユーザーは他のSNSへの「大移動」を検討していた人もいたようだ。移動先としていくつかのSNSが注目されたが、急先鋒は米メタの対抗サービス「Threads」(スレッズ)だろう。 UIをTwitterにかなり似せてきたThreadsが1億ユーザーを獲得するためにかかった日数はわずか5日。このスピードの要因には、メタが擁するInstagramとの連携が功を奏したのは確かだ。とはいえ、ChatGPTが1億ユーザーに達するまでの「約2カ月」という驚異的なスピードをさらに上回ったことで、Threadsのリリース直後は相当もてはやされていたように思う。 ところが「山高ければ谷深し」という言葉にもあるように、現在ユーザーのThrea

                        “Twitterキラー”スレッズ、関心はピークの50分の1 不満溢れる「X」が意外に順調なワケ
                      • 近似最近傍探索ライブラリVoyagerで類似単語検索を試す

                        本記事について 2023年10月にSpotifyが新たな近似最近傍探索ライブラリとして「Voyager」を発表した[1]。本記事ではVoyagerについて調べたことや、単語の類似検索をユースケースとした実装サンプル、Annoyとの性能比較の結果を備忘としてメモしておく。 近似最近傍探索とは Voyagerの話に入る前に、近似最近傍探索について説明する。 最近傍探索 (Nearest Neighbor Search)とは、あるベクトルのクエリが与えられたときに、そのクエリと「最も似ているベクトル」をベクトルの集合から見つける技術である。 ナイーブな方法としては、クエリのベクトルと、集合の一つ一つのベクトルとの距離をコサイン類似度などで計算し、最も距離が近いものを抽出する線形探索が考えられる。しかし、このアプローチではO(N)(Nは集合のサイズ)で探索に時間がかかるため、データセットが膨大にな

                          近似最近傍探索ライブラリVoyagerで類似単語検索を試す
                        • キーワード探しに困ったらこれ!ブログ記事に迷ったときのポイント #キーワード #ブログ #記事 - 雨のち晴れ

                          ブログを書くときにポイントとなってくるのは、読者の方がどういった内容を読みたいと思っているのかだと思います。たくさんの方が検索エンジンを通じて、ブログ記事を読みにきていただけると、それだけブログのアクセス数も増加し、ブログが育っていきます。書く内容が明確であれば、すぐに書き始めることもできるのですが、書く内容が迷ったとき、ネタが尽きてしまったときにはどうすればよいのでしょうか?そのようなときには、何かキーワードを探さなければなりません。この記事では、ブログ記事に困ったときのポイントについてお伝えします。 ブログのキーワードを選ぶ際には、検索エンジン最適化(SEO)や読者のニーズを考慮することが重要です。参考にしていただければと思います。 目標の設定 1.ブログ記事の目的明確化 2.ターゲット読者層の把握 ニッチキーワードの特定 1. テーマやジャンルの明確化 2.特化したキーワードの選定

                            キーワード探しに困ったらこれ!ブログ記事に迷ったときのポイント #キーワード #ブログ #記事 - 雨のち晴れ
                          • Perplexityが「Pages」を発表 - 最強のAI記事ジェネレーター | AI専門ニュースメディア AINOW

                            ソフトウェアエンジニア兼イラストレーターで、AI専門メディアGenerative AIとZeniteqを運営するジム・クライブ・モンジュ(Jim Clyde Monge)氏(詳細は同氏のLinkedInページを参照)がMediumに投稿した記事『Perplexityが「Pages」を発表 – 最強のAI記事ジェネレーター』では、検索AIのPerplexityの新機能であるPerplexity Pagesが紹介されています。 Perplexity Pagesの特徴を箇条書きにすると、以下のようになります。 Perplexity Pagesの特徴 Perplexity Pagesとは、特定のトピックについてPerplexityが検索して生成した文章をウェブ記事化するサービス。 Perplexity Pagesで生成された記事は、ウィキペディアのような簡潔なレイアウトをしている。 対象読者を「誰

                              Perplexityが「Pages」を発表 - 最強のAI記事ジェネレーター | AI専門ニュースメディア AINOW
                            • [Software Design連動企画] 実践クエリチューニング | gihyo.jp

                              この記事は、『Software Design 2024年6月号』(2024年5月17日発売)の第1特集「SQLチューニングする前に知っておきたい 実行計画&インデックスのしくみ」の連動企画です。ぜひ本誌特集1もお読みください。 適切なインデックスを設計する インデックスの調整によるクエリの高速化は、RDBMSを使用する際の数あるチューニングテクニックの中でも最もお手軽なものです。テーブルのカラムの定義を変えるわけではないので、クエリの結果に違いが生じず、アプリケーションを変更する必要性がないからです。適切なインデックスを付与するだけでチューニングが済むというのは極めて効率的です。それでは適切なインデックスとはどのようなものでしょうか。本記事では、まずインデックスを設計する際に重要なポイントを解説します。 インデックスとSQL構文 「どのカラムの組み合わせに対してインデックスを作成すべきか」

                                [Software Design連動企画] 実践クエリチューニング | gihyo.jp
                              • 実例で理解するベクトル検索。YouTubeの関連動画検索をつくってみた

                                生成AIの隆盛に伴い、ベクトル検索やベクトルデータベースが注目されています。 ベクトルについてより理解するために簡単なデモサービスを作ってみました。 この記事では作ったサービスをもとにベクトルについて説明し、後半では生成AIとベクトルの関連について紹介します。 つくったもの 「しもふりサーチ」 - お笑いコンビ「霜降り明星」のYouTubeチャンネル、「しもふりチューブ」の過去動画を検索できるサービスです。 このサービスには以下の2つの機能があります。 1. 文章での動画検索 文章で動画を検索する 「粗品さんがクイズを出題する回」 や 「せいやさんがギターを弾く回」 など、自然言語で動画を検索できます。 2. 関連動画レコメンド 内容の近い動画をレコメンドする 動画を選ぶと、過去動画の中から内容の近い動画をレコメンドします。 これらの機能はベクトル検索で実現されています。詳細を説明していき

                                  実例で理解するベクトル検索。YouTubeの関連動画検索をつくってみた
                                • AIがユーザーの意図を察して補助するBing新機能「ディープ検索」が一般公開! その実力を試す【イニシャルB】

                                    AIがユーザーの意図を察して補助するBing新機能「ディープ検索」が一般公開! その実力を試す【イニシャルB】
                                  • A search engine in 80 lines of Python

                                    February 05, 2024 · 26 mins · 4728 words Discussion on HackerNews. Last September I hopped on board with Wallapop as a Search Data Scientist and since then part of my work has been working with Solr, an open source search engine based on Lucene. I’ve got the basics of how a search engine works, but I had this itch to understand it even better. So, I rolled up my sleeves and decided to build one fr

                                    • RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A Day in the Life

                                      この記事は、情報検索・検索技術 Advent Calendar 2023の12月4日の記事である。 昨今のLLMの台頭により、外部情報を In-Context Learning として利用しLLMの生成結果の性能を高めることが可能な RAG(Retrieval Augmented Generation) の重要性の高まりを感じる。ただ、RAG を使ったシステムを構築してみようにも、データが少ないと面白みが少なかったりする。その為、Wikipedia 日本語の約550万文から簡単に検索可能でRAGの入力データとして使えるような embeddings と、素早い速度でベクトル検索できるような faiss 用の index を作成した。 例えば、Wikipedia から該当の文を検索する用途はこのように使える。 from datasets.download import DownloadMana

                                        RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A Day in the Life
                                      • Solr クエリを速度改善したら Solr 全体のパフォーマンスが向上した - 一休.com Developers Blog

                                        この記事は 一休.com Advent Calendar 2023 6日目の記事です。 一休レストランの開発チームでエンジニアをしている香西です。 今回は Solr クエリの速度改善についてお話します。 背景 2023年10月、一休レストランのスマートフォン用 レストラン詳細ページをリニューアルしました! UI/UX の見直しとともに、使用技術も一新しました。 バックエンド言語:Python から Rustへ フロントエンドフレームワーク:Nuxt.js から Next.jsへ*1 スマートフォン用 レストラン詳細ページ 課題 「日付を選ぶカレンダーの表示が遅い」 社内限定リリースの直後、多方面からこの声が聞こえてきました... レストランへ行く日付を選ぶカレンダーは予約フローの第一ステップなので、表示速度が遅いことは致命的です。 特に、設定データ(料理のコース種類・席の種類など)が多いレ

                                          Solr クエリを速度改善したら Solr 全体のパフォーマンスが向上した - 一休.com Developers Blog
                                        • 2023 年の Bard 活用方法トップ 10を発表

                                          メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                                            2023 年の Bard 活用方法トップ 10を発表
                                          • 官報、電子版が正本に 改正法成立 「ネットで無料で閲覧可能に」とデジタル庁

                                            官報のデジタル版は現在も「インターネット官報」で公開されているが、無料で閲覧できるのは直近90日間のPDFデータのみ。検索したい場合は有料サービスに登録する必要がある。 新法についてデジタル庁は「インターネットでいつでも・どこでも・無料で閲覧できるよう、官報の電子化と連携して法令立案プロセスのDXを進める」としている。 関連記事 破産者情報サイトに停止命令 個人情報保護委 個人情報保護委員会が、破産者情報サイトに停止命令。従わない場合は、刑事告発を検討する。 個人情報保護委員会、「新・破産者マップ」調査へ 「事実確認の上で適切に対処したい」 自己破産した人の氏名や住所をGoogleマップ上にプロットした「破産者マップ」が公開されている問題に対し、個人情報保護委員会は対応を進めていることを明らかにした。 閉鎖した「破産者マップ」、行政指導されていた 個人情報保護法に違反? 個人情報保護委員会

                                              官報、電子版が正本に 改正法成立 「ネットで無料で閲覧可能に」とデジタル庁
                                            • 「満足度が高まるわけではなかった」Google、検索結果を自動的に読み込む“無限スクロール”廃止へ【やじうまWatch】

                                                「満足度が高まるわけではなかった」Google、検索結果を自動的に読み込む“無限スクロール”廃止へ【やじうまWatch】
                                              • Perplexity Pro | スマートフォン・携帯電話 | ソフトバンク

                                                キャンペーン期間:2024.6.19~2025.6.18 Perplexity ProはPerplexity AI, Inc.が提供するサービスです ※1上記価格は2024年6⽉19⽇時点のAndroid OS版の価格です。他の2024年6⽉19⽇時点の通常価格は以下の通りです。 いずれもソフトバンク・ワイモバイル・LINEMOのユーザーは1年間無料となります。 iOS版 ⽉3,000円 / 年30,000円 | Android OS版 ⽉2,950円 / 年29,500円 | WEB ⽉$20 / 年$200 なお、最新の価格は各アプリストア⼜はWEB上でご確認ください。 ※1上記価格は2024年6⽉19⽇時点のAndroid OS版の価格です。他の2024年6⽉19⽇時点の通常価格は以下の通りです。 いずれもソフトバンク・ワイモバイル・LINEMOのユーザーは1年間無料となります。 i

                                                  Perplexity Pro | スマートフォン・携帯電話 | ソフトバンク
                                                • 子供に使わせるブラウザと、その検索エンジンってどうすりゃいいの?

                                                  google検索の劣化して専門家はdiscordに行ってしまいインターネットには屑情報だけになってしまった https://orangestar2.hatenadiary.com/entry/2024/02/13/174845 google検索の劣化について、首がもげるほど同意した。というか個人的にタイムリーすぎてびびった。 というのも月曜に、子供の自由研究みたいなの手伝って星のベテルギウスについて調べたのね。そしたら重さのところにkg以外にMみたいな記号があったから、なんやろって思ってiPadで「星の重さ M」でぐぐったら↓のサイトが2位ぐらいにひっかかちゃったのよ。(ほんとうはURL貼りたくないのだが) https://planetariodevitoria.org/ja/espaco/quantos-quilos-tem-uma-estrela.html で文章が変なのでAI生成くさ

                                                    子供に使わせるブラウザと、その検索エンジンってどうすりゃいいの?
                                                  • LLM技術と外部データ活用による検索・回答精度向上手法(ファインチューニング、セマンティック検索、In-Context Learning、RAG)と著作権侵害|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

                                                    第1 はじめに FAQシステムやチャットボットなど「何か知りたいこと(検索文・質問文)」を入力して検索や回答生成を行うに際して、検索や回答精度を向上させたり、回答根拠を明示させるために、LLM技術と外部データを組み合わせたシステムの研究開発や実装が急速に進んでいます。 LLMが外部データを参照できるようにするには、LLMそのものをFine-tuningする方法、プロンプトで情報を与える方法、RAGによって外部データを保存したデータベース (Data Base; 以下DB) から呼び出す方法の3つがあります。 ここでいう「外部データ」とは、「LLMの外部にあるデータ」という意味でして、その中には社内文書や、書籍・ウェブページ上のデータなどが含まれます。当該「外部データ」の中には、他人が著作権を持つ著作物(以下「既存著作物」といいます)も含まれるため、それら既存著作物を外部データとして利用する

                                                      LLM技術と外部データ活用による検索・回答精度向上手法(ファインチューニング、セマンティック検索、In-Context Learning、RAG)と著作権侵害|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
                                                    • Pinterest社で運用されているText-to-SQLを理解する

                                                      導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 本記事では、Pinterest社のエンジニアチームが紹介していた、実運用環境におけるText-to-SQLの構築方法に関する記事の紹介をします。 Text-to-SQLを実際の運用レベルで実現するための手法が解説されているので、その内容を解説、そして考察していきたいと思います。 なおこの手法には特に名前などは設定されていなかったので、以降Pinterest社の提案するText-to-SQLをPinterest Text-to-SQLと呼称します。 サマリー Pinterest Text-to-SQLは、RAGのシステムを最適化することで 検索に必要なTableのより正確な抽出 実際に使用されている値に準拠

                                                        Pinterest社で運用されているText-to-SQLを理解する
                                                      • ベクトル検索(Vector Search)とは? キーワード検索との違い

                                                        ベクトル検索(Vector Search)とは? キーワード検索との違い:AI・機械学習の用語辞典 用語「ベクトル検索」について説明。テキストなどのデータを数値ベクトル(埋め込み)として表現し、それらのベクトル間の類似度を計算することで、関連する情報を見つけ出す検索方法を指す。Azure OpenAI Serviceの独自データ追加機能で利用可能な「キーワード検索」「ベクトル検索」「ハイブリッド検索」「セマンティック検索」という検索手法の違いについても言及する。 連載目次 用語解説 AI/機械学習/自然言語処理におけるベクトル検索(Vector Search:ベクター検索)とは、テキストや画像などのデータを数値ベクトルとして表現し、それらのベクトル間の類似度(主にコサイン類似度)を計算することで、関連する情報を見つけ出す検索方法のこと、またその方法による検索のことである。なお、数値ベクトル

                                                          ベクトル検索(Vector Search)とは? キーワード検索との違い
                                                        • Azure OpenAI ServiceによるRAG実装ガイドを公開しました | SIOS Tech. Lab

                                                          みなさん、こんにちは。サイオステクノロジー武井です。今回は、Azure OpenAI ServiceによるRAG実装ガイドを公開しましたので、ご紹介させてください。 ※ このブログでのご紹介ととも以下のイベントでもガイドに関する詳細なご説明や、ガイドにはないデモなどを実施しますので、ぜひご参加ください。 Azure OpenAI ServiceによるRAG実装ガイドを公開しました https://tech-lab.connpass.com/event/315703 Azure OpenAI ServiceによるRAG実装ガイドとは? 以下のURLで公開しております。執筆しているうちに100ページ超の壮大なものとなってしまいました。 https://dev.noriyukitakei.jp/docs/aoai-rag-dev-guide.pdf 本ガイドの目的は、「シンプル」「強力」「すぐ動

                                                            Azure OpenAI ServiceによるRAG実装ガイドを公開しました | SIOS Tech. Lab
                                                          • ZOZOTOWN検索における精度評価手法の運用で見えた課題とその改善アプローチ - ZOZO TECH BLOG

                                                            こんにちは。検索基盤部の橘です。検索基盤部では、ZOZOTOWNのおすすめ順検索の品質向上を目指し、機械学習モデル等を活用しフィルタリングやリランキングによる検索結果の並び順の改善に取り組んでいます。 ZOZOTOWN検索の並び順の精度改善の取り組みについては以下の記事をご参照ください。 techblog.zozo.com 検索基盤部では新しい改善や機能を導入する前にA/Bテストを行い効果を評価しています。A/Bテストの事前評価として、オフラインの定量評価と定性評価を実施しています。これらの評価によりA/Bテストの実施判断をしています。 おすすめ順検索のフィルタリング処理の効果検証として導入したオフライン定量評価の方法については以下の記事をご参照ください。 techblog.zozo.com 以前の記事で紹介したオフライン評価を日々運用する中で、幾つか課題点が見つかりました。本記事では、そ

                                                              ZOZOTOWN検索における精度評価手法の運用で見えた課題とその改善アプローチ - ZOZO TECH BLOG
                                                            • 「四季報AI」β版で分かった、AIだからできること、そして想定外のニーズ

                                                              ChatGPTをはじめとする生成AIの動きも、実にさまざまな進化が続き、すでに業務改善DXのような形で、ビジネスの現場でも活用されています。そんな中、これまでとは少し変わった形でリリースされたのが、東洋経済新報社の「四季報AI」です。 四季報AIは、米OpenAIのチャットAI、ChatGPTを活用し、会社四季報オンラインに掲載されている記事やデータを主な参考元として、株式投資や銘柄研究に役立つヒントを、対話形式で引き出すことができるサービスです。 なるほど、この四季報AIは、ChatGPTそのものだけに何かしらの回答を求めるのではなく、ChatGPTを経由して、これまで東洋経済新報社が蓄積してきた膨大なデータに辿り着きやすくする試みだと思われました。 実際、サービス設計も、現在はβ版(招待制、無料で提供)として運用されていますが、正式版リリース後は「会社四季報オンライン」の有料プランの付

                                                                「四季報AI」β版で分かった、AIだからできること、そして想定外のニーズ
                                                              • 「Bing」で「rakuten」と検索するとサポート詐欺サイトを踏んでしまうかも/当面の間は自衛するしかなさそう【やじうまの杜】

                                                                  「Bing」で「rakuten」と検索するとサポート詐欺サイトを踏んでしまうかも/当面の間は自衛するしかなさそう【やじうまの杜】
                                                                • kaggle LLMコンペ 上位解法まとめ

                                                                  はじめに 科学分野の5択問題を解くLLMの精度を競うKaggle - LLM Science Exam というkaggleコンペが2023/10/11まで開催されていました。 コンペ終了後に公開された上位チームの解法からたくさん学びがあったので、備忘録も兼ねてまとめていきたいと思います。 コンペ概要 問題文(prompt)とA~Eの選択肢(option)が与えられ、それを解くモデルの精度を競うコンペでした。 テストデータはSTEM分野のWikipedia記事からGPT3.5に作成させたことがDataタブで明言されていました。 上位チーム解法まとめ 1. Approach 全てのチームが、問題の生成元となった記事をwikiテキストデータセットから検索(Retrieval)し、関連するテキスト(context)もモデルに入力するRAGと呼ばれるアプローチを採用していました。 RAGを行わないと

                                                                    kaggle LLMコンペ 上位解法まとめ
                                                                  • Cognitive Searchの生成AI用ベクトルDBの構築手順書 - Qiita

                                                                    はじめに この記事は、現在(2023年8月4日時点)パブリックプレビュー中のCognitive Searchのベクトル検索機能について、ベクトルDBの構築手順を解説する記事です。公式ドキュメントにはクイックスタート記事も公開されており、こちらのブログで日本語で丁寧に解説してくれています。 公式ドキュメントのクイックスタートを読んでいると、下記の課題に遭遇します。 PDFなどのドキュメントはどのように扱えばいいか? チャンク分割やベクトル生成は具体的にどのように行えばよいか? 言語アナライザーを日本にするにはどこを変えればよいか? インデックスを自動更新するにはどうすれば良いか? このような課題に対して、Azure公式のGitHubリポジトリにあるcognitive-search-vector-prにあるインデックス作成ツール(azure-search-vector-ingestion-py

                                                                      Cognitive Searchの生成AI用ベクトルDBの構築手順書 - Qiita
                                                                    • リアルタイム検索最適化:Reactアプリにdebounce処理を組み込む - Techtouch Developers Blog

                                                                      はじめに そもそも debounce 処理って? 本題 今回作りたかったもの 検討したこと useDebounce useDebouncedValue 実装したもの 最後に はじめに テックタッチのフロントエンドエンジニアの ozaan (@shzawa) です。関西 (兵庫県姫路市) 在住のため、普段はフルリモートのメンバーとしてサービス開発に取り組んでいます。 最近はスクラム開発の一環でバックエンドのコード (golang) を触らせてもらっていました。golang だと書き方が統一されているためか GitHub Copilot の補完機能がかなり効くので書いていて面白かったです。 そもそも debounce 処理って? 対象のイベントが発生してから指定した時間が経過するまでは、同じイベントの発生を抑制する仕組みです。 input 要素の onChange イベントのような短い間隔で連

                                                                        リアルタイム検索最適化:Reactアプリにdebounce処理を組み込む - Techtouch Developers Blog
                                                                      • 【サーベイ論文まとめ】RAG(Retrieval-Augmented Generation) - Qiita

                                                                        『Retrieval-Augmented Generation for Large Language Models: A Survey(以下、RAG Survey論文と表記)』の内容について以下、取りまとめました。 https://arxiv.org/abs/2312.10997v5 概要 RAG研究のまとめ RAG Survey論文 Fig.1 上記では、RAGの研究が「Fine-tuning」・「Pre-training」・「Inference」の3種類に分類されます。 RAG Survey論文の構成 Survey論文の構成は『Ⅰ. Introduction』に概要が記載されているので、以下に簡単にまとめました。 Abstract Ⅰ. Introduction -> Surveyの概要について取りまとめ Ⅱ. Overview of RAG -> RAGのメインのコンセプトと現在の枠

                                                                          【サーベイ論文まとめ】RAG(Retrieval-Augmented Generation) - Qiita
                                                                        • OpenAIが2024年5月13日にGoogleのライバルとなる「AI検索エンジン」を発表するとの報道

                                                                          OpenAIがAIを活用した検索サービス、もしくはChatGPTがウェブから情報を入手できるようにする拡張機能の発表を目前に控えていると、複数のメディアが報じました。発表は、Googleの年次カンファレンスであるGoogle I/O 2024が開催される2024年5月14日の前日に行われると予想されています。 OpenAI plans to announce Google search competitor on Monday, sources say | Reuters https://www.reuters.com/technology/openai-plans-announce-google-search-competitor-monday-sources-say-2024-05-09/ Apple to Power iOS 18 AI Features With In-House

                                                                            OpenAIが2024年5月13日にGoogleのライバルとなる「AI検索エンジン」を発表するとの報道
                                                                          • 「Googleのせいで生活費が高くなっている」として総額1兆3000億円超の補償を求める集団訴訟が提起される

                                                                            検索や広告、クラウドサービス、ハードウェアなどさまざまな事業を世界中で手がけるGoogleは、日々さまざまな訴訟に巻き込まれています。新たにイギリスでは、「Googleの広告ビジネスのせいで人々の生活費が高くなっている」として集団訴訟が提起されました。 Google faces multibillion-pound lawsuit from UK consumers | Google | The Guardian https://www.theguardian.com/technology/2023/sep/07/google-faces-multibillion-pound-lawsuit-uk-consumers 今回イギリスの競争控訴審判所に提出された訴訟は、Googleが競争法(独占禁止法)に違反して検索エンジン市場での競争を抑制し、それによってイギリス経済全体の価格上昇を引き起こ

                                                                              「Googleのせいで生活費が高くなっている」として総額1兆3000億円超の補償を求める集団訴訟が提起される
                                                                            • Amazon OpenSearch Serviceのデータが全消え&ダッシュボードにログインできなくなりました - ecbeing labs(イーシービーイング・ラボ)

                                                                              こんにちは。ReviCo[レビコ]開発チームの金澤です。 本年も当ブログは細く長くを目標に続けていきますのでよろしくお願いします。 今回は、昨年末にOpenSearchが破損した事件についてまとめようと思います。 OpenSearch破損… 当時の構成と事象 構成 事象 AWSサポートからの回答 復旧について 教訓:OpenSearchはシングルノードで動かしちゃあかん… おわりに OpenSearch破損… 去る2023年12月25日、我が家の子どもたちも無事にサンタさんからプレゼントを受け取り、今年もあと1週間かぁと思いながら出社すると、開発環境のOpenSearchがぶっ壊れていました…。 ドキュメントがごっそり消えてる… 当時の構成と事象 構成 t3.small.search インスタンス シングルノード 事象 プログラムからOpenSearchに接続できなくなった ダッシュボード

                                                                                Amazon OpenSearch Serviceのデータが全消え&ダッシュボードにログインできなくなりました - ecbeing labs(イーシービーイング・ラボ)
                                                                              • 【アカウントに基づく情報の表示設定が原因】GoogleにFANZAやDLSiteやDLチャンネルが検索に全く出てこない問題が発生→こうすれば解決する!

                                                                                猫乃またたび@新刊販売中 @nknmttb_nitijo 先程のメロンやとら、コミフロがGoogle検索でTOPに出てこないというTweetだけど、FANZAも同様にプレスリリースやサポートページなど関連記事ばかりがあがって肝心なサイトのTOPは検索に出てこないですね これはエロ関係を扱ってるサイトが”村八分”処理されたか??(DLsiteはTOPページ出てきた) pic.twitter.com/RxVnCTsiat 2023-10-31 08:52:35

                                                                                  【アカウントに基づく情報の表示設定が原因】GoogleにFANZAやDLSiteやDLチャンネルが検索に全く出てこない問題が発生→こうすれば解決する!
                                                                                • 気になったら、丸でかこって検索しましょう

                                                                                  メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                                                                                    気になったら、丸でかこって検索しましょう