canadieのブックマーク - はてなブックマーク

ロングコンテキストLLMに対応したRAGの新アーキテクチャ｜npaka

以下の記事が面白かったので、簡単にまとめました。・Towards Long Context RAG - LlamaIndex 1. はじめにGoogleは、1Mコンテキストウィンドウを持つ「Gemini 1.5 Pro」をリリースしました。初期ユーザーは、数十もの研究論文や財務報告書を一度に入力した結果を共有しており、膨大な情報を理解する能力という点で印象的な結果を報告しています。当然のことながら、ここで疑問が生じます。「RAG」は死んだのでしょうか？そう考える人もいますが、そうではない人もいます。幸運にも「Gemini 1.5 Pro」の機能をプレビューすることができ、それを試してみることで、ロングコンテキストLLMを適切に使用するには、RAGがどのように進化するのかについてのまとめました。 2. Gemini 1.5 Pro の初期観察「Gemini」の結果は印象的で、テクニカ

canadie 2024/03/04

コストが十分に下がり、Skip in the middle（AIの読み飛ばし）が減ればRAGの必要性は減っていくだろうが、RAGも十分強力なのでしばらくは残ると思う。

あとで読む

リンク

Microsoft Copilot Studio によるカスタムCopilot の作成｜npaka

2. カスタムCopilotの作成手順「カスタムCopilot」の作成手順は、次のとおりです。 (1) 「Microsoft Copilot Studio」のサイトを開き、「try free」からログイン。 (2) 「コパイロットを作成する」の「新しいコパイロット」をクリック。 (3) 以下のように設定して、作成ボタンを押す。「日本語」は生成AI機能に未対応だったので「英語」、会話を強化するためのURLは「OpenAIのURL」にしました。・コパイロットの名前 : MyCopilot ・コパイロットの話す言語 : 英語・生成型の回答で会話を強化する : https://openai.com/ (4) 「Copilotのテスト」でメッセージを入力して動作確認。「GPT-4Vについて教えてください。」の質問に、ソース付きで回答してくれました。 (5) 公開タブの公開ボタンでCopilo

canadie 2023/11/22

リンク

Google Colab で OpenAI API の Code Interpreter を試す｜npaka

「Google Colab」で「OpenAI API」の「Code Interpreter」を試したので、まとめました。前回 1. Code Interpreter「Assistant API」は、さまざまなタスクを実行できる強力な「AIアシスタント」を作成するためのAPIです。「Assistant API」は現在、次の3つのツールをサポートしています。・Code Interpreter : Pythonコードを作成して実行・Retrieval : モデル外部からの知識を取得・Function Calling : 関数のレスポンスを取得今回は、「Code Interpreter」を使います。「Code Interpreter」は、「Assistant API」がサンドボックス実行環境でPythonコードを作成して実行できるツールです。さまざまなデータと形式を含むファイルを処理し

canadie 2023/11/12

あとで読む

リンク

Google Colab で OpenAI API の Retrieval を試す｜npaka

「Google Colab」で「OpenAI API」の「Retrieval」を試したので、まとめました。前回 1. Retrieval「Assistant API」は、さまざまなタスクを実行できる強力な「AIアシスタント」を作成するためのAPIです。「Assistant API」は現在、次の3つのツールをサポートしています。・Code Interpreter : Pythonコードを作成して実行・Retrieval : モデル外部からの知識を取得・Function Calling : 関数のレスポンスを取得今回は、「Retrieval」を使います。「Retrieval」は、製品情報やユーザーから提供されたドキュメントなど、モデル外部からの知識を取得して、アシスタントを強化します。ファイルをアップロードして「アシスタント」に渡すと、自動的にドキュメントをチャンク化し、埋め込みの

canadie 2023/11/08

リンク

OpenAI DevDay で発表された新モデルと新開発ツールまとめ｜npaka

以下の記事が面白かったので、かるくまとめました。・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

canadie 2023/11/07

ツール作る側だけどできることが広がって嬉しいよ？

リンク

Google Colab で Xwin-LM-70B-V0.1-GPTQ を試す。｜npaka

「Google Colab」で「Xwin-LM-70B-V0.1-GPTQ」を試したので、まとめました。【注意】Google Colab Pro/Pro+のA100で70Bを動作確認しています。 1. Xwin-LM-70B-V0.1-GPTQ「Xwin-LM」は、ベンチマーク「AlpacaEval」で「GPT-4」を追い抜き1位を獲得したモデルです。今回は、「TheBloke/Xwin-LM-70B-V0.1-GPTQ」を利用します。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) Colabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」の「A100」を選択。 (2) パッケージのインストール。 GPTQを利用するため、「auto-gptq 」もインストールしています。 # パッケージのインストール !pip install t

canadie 2023/09/24

リンク

OpenAIのファインチューニングAPIによる GPT-4 から GPT-3.5 への蒸留を試す｜npaka

OpenAIのファインチューニングAPIによる GPT-4 から GPT-3.5 への蒸留を試したのでまとめました。 1. GPT-4 から GPT-3.5 への蒸留「LlamaIndex」で、OpenAIのファインチューニングAPIによる GPT-4 から GPT-3.5 への蒸留のColabが提供されてたので、それをベースに独自データで試してみました。具体的には、「GPT-4」で学習データを生成し、「GPT-3.5」でファインチューニングすることで、「GPT-3.5」に「GPT-4」相当の知識を習得させます。 We successfully made gpt-3.5-turbo output GPT-4 quality responses in an e2e RAG system 🔥 Stack: automated training dataset creation in @ll

canadie 2023/08/27

特定の知識を与えたい時、大量の前提データから正確かつ大量のQA形式の訓練データを作る必要があるのだが、それをGPT-4にやらせると言う話。GPT-4相当の性能になるわけではない

リンク

Code Llama の概要｜npaka

以下の記事が面白かったので、かるくまとめました。・Introducing Code Llama, a state-of-the-art large language model for coding 1. はじめに「Code Llama」は、コードと自然言語の両方からコードとコードに関する自然言語を生成できる最先端のLLMです。研究および商用利用が可能で、無料で利用できます。「Code Llama」は「Llama 2」ベースで、次の3つのモデルを提供します。・Code Llama : 基本的なコード生成モデル。・Code Llama - Python : Pythonに特化したコード生成モデル。・Code Llama - Instruct : 自然言語の指示を理解できるようにファインチューニングしたモデル。ベンチマークテストではコードタスクにおいて、公的に入手可能な最先端のLL

canadie 2023/08/26

100kトークンはすごいな。Codexは8kトークンくらいだっけ。gpt-3相当の性能しかないとしても多少の長さのコードは俯瞰できる長さがある

リンク

OpenAI API のファインチューニングガイド｜npaka

1. ファインチューニングの利点ファインチューニングの利点は、次のとおりです。 (1) プロンプトよりも高品質な応答 (2) プロンプトに収まりきらないより多くの例の適用 (3) プロンプトの短縮によるトークン数 (コスト) の節約 (4) プロンプトの短縮による処理時間の短縮モデルは膨大な量のテキストで事前学習されており、このモデルを効果的に利用するため、プロンプトに手順や応答の例を指定する手法が使われます。この例を使用してタスクの実行方法を示すことを「Few-Shot」と呼びます。ファインチューニングで、プロンプトに収まりきらないより多くの例で学習することにより、さまざまなタスクでより良い結果を達成できるようになります。プロンプトに多くの例を指定する必要はなくなります。これによりトークン (コスト) が節約され、処理時間も短縮されます。 2. ファインチューニングの使用料金ファイン

canadie 2023/08/24

npnaka さん速い。汎用会話エンジンではなく特定のタスク（分類・感情分析など）を高速で回したいケースで威力を発揮しそう

リンク

はてなブックマーク

タグ

ブックマーク / note.com/npaka (9)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス