  • Boosting RAG: Picking the Best Embedding & Reranker models

    UPDATE: The pooling method for the Jina AI embeddings has been adjusted to use mean pooling, and the results have been updated accordingly. Notably, the JinaAI-v2-base-en with bge-reranker-largenow exhibits a Hit Rate of 0.938202 and an MRR (Mean Reciprocal Rank) of 0.868539 and withCohereRerank exhibits a Hit Rate of 0.932584, and an MRR of 0.873689. When building a Retrieval Augmented Generation

    • ChatGPT達人が発明した最強の「業務時短ツール」

      ChatGPTを連携したのは、届いた文字起こしを要約させるため。Make上で「あなたは議事録を要約して、まとめるアシスタントです。議事録のデータが届くので、適切に要約してください」などと入力することで、AIが長大な議事録の要約を作ってくれる。 平岡さんはほかにも、「すぐ質問してくる部下への回答を自動化」「LINEの顧客対応を自動化」など、ツイッターやYouTubeでChatGPTなどを活用した「業務時短ツール」の作り方を紹介している。 個人DXの最強ツール 平岡さんがこうした発信を続けるのは、「非エンジニアでも自分が得をするためのDX(デジタル変革)が手軽にできることを伝えたい」という目標があるからだ。 平岡さんは独立前、企業のDXを推進する仕事をしていた。そこで直面したのは、企業としていくらDXを掲げていても現場のモチベーションが上がらず、進展しないという事態だった。 「結局、個人が得を

      • いろんなT5からSentence Embeddingをとって遊ぶ | Shikoan's ML Blog

        自然言語処理モデルT5を使って文章単位の埋め込み量(Sentence Embedding)を取得することを考えます。T5のEmbeddingはトークン単位ですが、平均を取ることで、簡単に文章単位に変換できます。Sentence T5としてモデルが公開されていない場合でも、既存のT5から自在に特徴量を取得できることを目標とします。Flan-T5からSentence Embeddingをとって見たりします。 はじめに 普段画像処理ばっかりやってる自然言語処理素人だけど、Imagenで使っていたり、Unified IOがベースにしていたり、何かとT5を聞きますよね。 調べていたらtransformersのライブラリから簡単に利用できることがわかったので、今回遊んでいきたいと思います。このブログでは珍しいNLPの内容です。 問題点 (自然言語処理やっている人には当たり前かもしれませんが、)一つ問題

        • Skills Boost 生成 AI トレーニング : 日本語を無償公開 | Google Cloud 公式ブログ

          組織向け Google Cloud Skills Boost は、700 以上の学習アクティビティにオンデマンドでアクセスできるトレーニング サービスです。データ、AI、インフラストラクチャ、セキュリティなどのトピックに関するコース、クエスト、ハンズオンラボに参加して、スキルバッジを獲得できます。 この度、Skills Boost で大人気の 生成 AI 関連のコースとハンズオンラボをいち早く日本語化しました。 生成 AI コース大規模言語モデルの基本から Google Cloud 上で 生成 AI ソリューションを作成・デプロイする方法まで、生成 AI 関連製品と技術について無償で学ぶことができます。 Introduction to Generative AI - 日本語版: この入門レベルのマイクロラーニング コースでは、生成 AI の概要、利用方法、従来の機械学習の手法との違いについ

          • The AI Apocalypse: A Scorecard

            What should we make of OpenAI’s GPT-4, anyway? Is the large language model a major step on the way to an artificial general intelligence (AGI)—the insider’s term for an AI system with a flexible human-level intellect? And if we do create an AGI, might it be so different from human intelligence that it doesn’t see the point of keeping Homo sapiens around? If you query the world’s best minds on basi

            • LangChain の Googleカスタム検索 連携を試す|npaka

              1. Googleカスタム検索「Googleカスタム検索」は、WebサイトやアプリケーションでGoogle検索の機能を利用することができます。 LangChainのデフォルトの検索API「SerpAPI」との料金比較は、次のとおりです。 ◎ SerpAPI 無料版 : 1ヶ月に100クエリ 有料版 : 5000クエリで50ドル ◎ Googleカスタム検索 無料版 : 1日に100クエリ 有料版 : 1000クエリで5ドル 2. 検索エンジンIDとAPIキーの取得Googleカスタム検索のサイトで、新しい検索エンジン(の設定)を作成し、検索エンジンIDとAPIキーを取得します。 (1) Googleカスタム検索のサイトを開き、「使ってみる」を押す。 (2) 新しい検索エンジンを作成。 検索エンジンの名前とウェブ全体を検索を指定します。 (3) 「基本」の「検索エンジンID」をコピー。 (4

              • アマゾン、AWS上で生成AIを扱うクラウドサービス「Bedrock」を発表 (1/2)

                アマゾン傘下のAWS(Amazon Web Services)は4月13日(現地時間)、生成AIの開発に特化したクラウドサービス「Amazon Bedrock(以下Bedrock)」と大規模言語モデル「Amazon Titan(以下Titan)」を発表。 同時に、機械学習に特化したアマゾンの独自チップを使用した新たなクラウド基盤「Amazon EC2 Trn1n(以下Trn1n)」「Amazon EC2 Inf2(以下Inf2)」も発表、生成AIを使用したコーディングアシスタント「Amazon CodeWhisperer(以下CodeWhisperer)」の無料公開も明らかにした。 4つの基盤モデルを利用して独自の生成AIアプリを開発 一般的に生成AIはOpenAIの「GPT-4」やグーグルの「PaLM」といった膨大な量のデータで事前にトレーニングされた基盤モデルと呼ばれる非常に大きなモデ

                • PromptIDE

                  xAI PromptIDEIntegrated development environment for prompt engineering and interpretability research November 6, 2023 The xAI PromptIDE is an integrated development environment for prompt engineering and interpretability research. It accelerates prompt engineering through an SDK that allows implementing complex prompting techniques and rich analytics that visualize the network's outputs. We use it

                  • GitHub - UKPLab/sentence-transformers: Multilingual Sentence & Image Embeddings with BERT

                    This framework provides an easy method to compute dense vector representations for sentences, paragraphs, and images. The models are based on transformer networks like BERT / RoBERTa / XLM-RoBERTa etc. and achieve state-of-the-art performance in various tasks. Text is embedded in vector space such that similar text are closer and can efficiently be found using cosine similarity. We provide an incr

                    • Google Cloud、エンタープライズ向け生成 AI の利用を拡大 | Google Cloud 公式ブログ

                      ※この投稿は米国時間 2023 年 7 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。 生成 AI の開発は猛烈な勢いで続いており、この破壊的技術を活かせるようなエンタープライズ向け機能を利用できるかどうかがかつてなく重要となっています。 Google の数十年に及ぶ調査とイノベーション、そして AI への投資を活用することで、Google Cloud は常に、セキュリティとデータ ガバナンス、そして全体的なスケーラビリティが用意されている状態で生成 AI を利用できるようにしています。 この目的のため、先月 Google は Vertex AI での生成 AI サポートの一般提供を発表しました。これにより Google Research から優れた基盤モデルにアクセス可能となり、これらのモデルをカスタマイズして利用するためのツールも利用できるようになりま

                      • Can ChatGPT Replace UX Researchers?An Empirical Analysis of Comment Classifications – MeasuringU

                        ChatGPT. A sequence of letters that didn’t mean much to people a few months ago is now ubiquitous. It seems like every social media post mentions ChatGPT (especially the latest version, 4) and hypes it as a game changer. It’s been used to quickly summarize text, do homework, pass the bar exam, and code the game Duck Hunt from scratch. It’s been included as a feature in some UX software, and some h

                        • ChatGPT、Webブラウジング機能を復活 最新情報を利用可能に

                          • AI’s $600B Question

                            The AI bubble is reaching a tipping point. Navigating what comes next will be essential. In September 2023, I published AI’s $200B Question. The goal of the piece was to ask the question: “Where is all the revenue?” At that time, I noticed a big gap between the revenue expectations implied by the AI infrastructure build-out, and actual revenue growth in the AI ecosystem, which is also a proxy for

                            • Levels of AGI: Operationalizing Progress on the Path to AGI

                              We propose a framework for classifying the capabilities and behavior of Artificial General Intelligence (AGI) models and their precursors. This framework introduces levels of AGI performance, generality, and autonomy. It is our hope that this framework will be useful in an analogous way to the levels of autonomous driving, by providing a common language to compare models, assess risks, and measure

                              • 生成系 AI 体験ワークショップ

                                このワークショップでは、Generative AI (生成系 AI) を活用したアプリケーションを AWS 上に構築し、社内データを活用したチャットボットや要約、文章校正、画像生成などのユースケースを体験していきます。

                                • 生成AIを「業務で日常利用」は2割に到達 活用フェーズ突入へ

                                  AI(人工知能)スタートアップのエクサウィザーズは2023年8月末、生成AIの活用状況についてのアンケートを実施した。今回の調査は第2回で、生成AIを業務で日常的に活用する利用者は20%と、同年4月末に実施した第1回の同7%に比べて13ポイントの大幅増加となった。その他、導入対象や活用業務などのアンケートから、生成AIは「導入するかどうか」から「どう活用するか」へとフェーズが移っているのが浮き彫りとなった。 ChatGPTに代表される生成AI(人工知能)は、企業にとって「導入」から「活用」へとフェーズが移ったことが見て取れる(出所/Shutterstock)

                                  • CS25: Tranformers United!

                                    CS25: Transformers United V4 Spring 2024 Apr. 4 - May 30 Description Interested in Transformers, the deep learning model that has taken the world by storm? Want to have intimate discussions with researchers? If so, this course is for you! It's not every day that you get to personally hear from and chat with the authors of the papers you read! Each week, we invite folks at the forefront of Transfor

                                    • AIモデルの起用は老舗ファッションブランドには鬼門、中小新興ブランドには切り札に - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                      AI モデル Image credit: Lalaland.ai デニムブランドの Levi’s は3月、AI モデル会社 Lalaland.ai と提携し、AI が生成したモデルを使って服を紹介すると発表したが、人間のモデルから仕事を奪うという反発を招き、リーバイスは火消しに乗り出さざるをえなかった。 しかし、このアイデアは、中小のアパレルブランドにとってはチャンスかもしれない。中小のアパレルブランドは、写真撮影にかかる高額な費用に悩まされている。写真撮影にはモデルのギャラやヘアメイク、会場費などが含まれ、これらのコストは中小ブランドにとって大きな負担となっている。 そこで、AI を活用したモデルソリューション企業が登場し、中小ブランドにとって画期的な解決策となっている。例えば、Lalaland.ai や Botikaと いった企業は、月額15米ドルからの料金で AI モデルのサブスクリ

                                      • FinGPT:金融業界のための大規模言語モデル開発フレームワーク | AIDB

                                        金融業界は、AIの活用が求められる一方で、その複雑さと専門性から多くの課題がありました。しかし、コロンビア大学とニューヨーク大学の研究者らが開発した新フレームワーク「FinGPT」が、その課題を解決する可能性を秘めています。FinGPTは、誰でも金融分野特化の大規模言語モデルを開発することを可能にし、金融業界のAI開発を一歩前進させることを目指しています。 参照論文情報 タイトル:FinGPT: Open-Source Financial Large Language Models 著者:Hongyang Yang, Xiao-Yang Liu, Christina Dan Wang URL:https://doi.org/10.48550/arXiv.2306.06031 GitHub:https://github.com/AI4Finance-Foundation/FinGPT,htt

                                        • 「BloombergGPT」金融分野に特化した言語モデル登場 論文から解説 | AIDB

                                          自然言語処理技術は、近年急速に発展しており、様々な分野での応用が期待されています。特に、金融分野では、大量のテキストデータを扱う必要があるため、自然言語処理技術の活用は重要になってきています。しかし、金融分野に特化した言語モデルはまだ少なく、高い性能を発揮するものも限られています。 そこでBloomberg社は、「BloombergGPT」という金融分野に特化した言語モデルを開発しました。BloombergGPTは、同社の広範なデータソースを基にトレーニングされた50億パラメーターの言語モデルであり、金融タスクで高い性能を発揮すると考えられています。本記事では、開発背景やトレーニング方法、評価結果などについて、論文を参照して紹介いたします。論文のURLや著者情報は記事下部にて記載しています。 参照論文情報 タイトル:BloombergGPT: A Large Language Model

                                          • ControlNet: A Complete Guide - Stable Diffusion Art

                                            Updated March 16, 2024By AndrewCategorized as Tutorial Tagged ControlNet, Extension, Img2img 80 Comments on ControlNet: A Complete Guide ControlNet is a neural network that controls image generation in Stable Diffusion by adding extra conditions. Details can be found in the article Adding Conditional Control to Text-to-Image Diffusion Models by Lvmin Zhang and coworkers. It is a game changer. You

                                            • 「Qiitaに聞いた!!」をAmazon Bedrockで作った!(Claude 3でRAG) - Qiita

                                              出オチです。(タイトル先行で始める技術ブログがあってもいいじゃない) 先にデモを提示します。 自由に使っていただいて構いません。(びっくりする課金が来たら、止めますw) ここのところ、簡単に構築できる生成AIアプリづくりが個人的ブームになってます。Qiitaをナレッジの情報源としたRAGを作ってみましたので、作り方を解説します。 【未経験者大歓迎】RAG超入門:AWSが推奨するRAGを体験するハンズオンを見ていただいた方へ 上記投稿では、生成AI感がゼロでしたが、同様のことを、プロンプトを使って実現する内容となっています。 生成AIに興味を持っていただいた方は、本投稿も見ていただき、違いを感じていただければと思います。 使用するもの 生成AI:Amazon Bedrock (Claude 3 Haiku) ドキュメント取得:Google検索 画面UI:Streamlit 処理の流れ 先日投

                                              • https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index-Report_2023.pdf

                                                • Artificial Artificial Artificial Intelligence: Crowd Workers Widely Use Large Language Models for Text Production Tasks

                                                  Large language models (LLMs) are remarkable data annotators. They can be used to generate high-fidelity supervised training data, as well as survey and experimental data. With the widespread adoption of LLMs, human gold--standard annotations are key to understanding the capabilities of LLMs and the validity of their results. However, crowdsourcing, an important, inexpensive way to obtain human ann

                                                  • PostgreSQL を使用して生成 AI アプリケーションを構築するための AlloyDB AI を発表 | Google Cloud 公式ブログ

                                                    ※この投稿は米国時間 2023 年 8 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。 生成 AI は数え切れないほどの方法で私たちの想像力を捉えてきました。それは、人間のような反応をする chatbot だけでなく、まったく新しいユーザー エクスペリエンスを引き出してくれます。さらに、追加の専門的なスキルを必要とする従来の AI ワークロードとは異なり、これらの新しい生成 AI ワークロードは、デベロッパー コミュニティのより多くの開発者が利用できます。アプリケーション デベロッパーが生成 AI アプリケーションの構築に本格的に取り組む際、イノベーションの鍵はモデルそのものだけでなく、その使用方法やモデルの基盤にあるデータにもあります。 このたび、Google は、Google Cloud Next において、運用データを使用したパフォーマンスとスケーラ

                                                    • The New Language Model Stack

                                                      ChatGPT unleashed a tidal wave of innovation with large language models (LLMs). More companies than ever before are bringing the power of natural language interaction to their products. The adoption of language model APIs is creating a new stack in its wake. To better understand the applications people are building and the stacks they are using to do so, we spoke with 33 companies across the Sequo

                                                      • 16 Changes to the Way Enterprises Are Building and Buying Generative AI

                                                        16 Changes to the Way Enterprises Are Building and Buying Generative AI Generative AI took the consumer landscape by storm in 2023, reaching over a billion dollars of consumer spend1 in record time. In 2024, we believe the revenue opportunity will be multiples larger in the enterprise. Last year, while consumers spent hours chatting with new AI companions or making images and videos with diffusion

                                                        • OpenAI Platform

                                                          Explore resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's developer platform.

                                                          • GitHub - Yutong-Zhou-cv/Awesome-Text-to-Image: (ෆ`꒳´ෆ) A Survey on Text-to-Image Generation/Synthesis.

                                                            Text to Face👨🏻🧒👧🏼🧓🏽 (arXiv preprint 2024) [💬 3D] Portrait3D: Text-Guided High-Quality 3D Portrait Generation Using Pyramid Representation and GANs Prior, Yiqian Wu et al. [Paper] (CVPR 2024) CosmicMan: A Text-to-Image Foundation Model for Humans, Shikai Li et al. [Paper] [Project] (arXiv preprint 2024) Fast Text-to-3D-Aware Face Generation and Manipulation via Direct Cross-modal Mapping an

                                                            • h2oGPT

                                                              • GAFAの「黒子」が明かす AIインフラの想像絶する未来 - 日本経済新聞


                                                                • txtai

                                                                  All-in-one embeddings database txtai is an all-in-one embeddings database for semantic search, LLM orchestration and language model workflows. Embeddings databases are a union of vector indexes (sparse and dense), graph networks and relational databases. This enables vector search with SQL, topic modeling, retrieval augmented generation and more. Embeddings databases can stand on their own and/or

                                                                  • https://www.mckinsey.com/jp/~/media/mckinsey/locations/asia/japan/our%20insights/20230703_what-every-ceo-should-know_vs.pdf

                                                                    • GitHub - AI4Finance-Foundation/FinGPT: FinGPT: Open-Source Financial Large Language Models! Revolutionize 🔥 We release the trained model on HuggingFace.

                                                                      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                      • Llama 2: Open Foundation and Fine-Tuned Chat Models

                                                                        In this work, we develop and release Llama 2, a collection of pretrained and fine-tuned large language models (LLMs) ranging in scale from 7 billion to 70 billion parameters. Our fine-tuned LLMs, called Llama 2-Chat, are optimized for dialogue use cases. Our models outperform open-source chat models on most benchmarks we tested, and based on our human evaluations for helpfulness and safety, may be

                                                                        • https://www.sbert.netindex.html/

                                                                          • How To Use GPT-3, GPT-4, ChatGPT, GPT-J, And Other Generative Models, With Few-Shot Learning

                                                                            How To Use GPT-3, GPT-4, ChatGPT, GPT-J, And Other Generative Models, With Few-Shot Learning June 13, 2023 GPT-3, GPT-4, ChatGPT, GPT-J, and generative models in general, are very powerful AI models. We're showing you here how to effectively use these models thanks to few-shot learning, also known as prompt engineering. Few-shot learning is like training/fine-tuning an AI model, by simply giving a

                                                                            • [セッションレポート]【AIM108】Generative AI on AWS #AWSSummit | DevelopersIO

                                                                              こんにちは、yagiです。 5/4 開催の AWS Summit Berlin へ現地参加してきました! まずは朝一番の9時からのセッション、【AIM108】Generative AI on AWS に出席しました! Newサービスとして、Amazon Bedrock 等の紹介がありました。 Agenda What is Generative AI? Ganerative AI Applications and Foundation Models How does AWS support customers? How can you get started on AWS? What is Generative AI? Chat GPT のような、Generative AI は 今日の AI トレンドの中で最速で成長しており、 multimodality (マルチモダリティ:言語のみならず、

                                                                              • With Bedrock, Amazon enters the generative AI race | TechCrunch

                                                                                Amazon is throwing its hat into the generative AI ring. But rather than build AI models entirely by itself, it’s recruiting third parties to host models on AWS. AWS today unveiled Amazon Bedrock, which provides a way to build generative AI-powered apps via pretrained models from startups including AI21 Labs, Anthropic and Stability AI. Available in a “limited preview,” Bedrock also offers access t

