[B! LargeLanguegeModel] ymzkeyのブックマーク

Shikoan's ML Blog

36{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVLMに焦点をあて、AutoGPTQとBitsAndBytesという2つの量子化フレームワ […]...

ymzkey 2023/06/08

リンク

Prompt Engineering Guide – Nextra

Prompt Engineering Guide プロンプトエンジニアリングは、言語モデル（LMs）を効率的に使用するためのプロンプトを開発および最適化する比較的新しい学問分野です。プロンプトエンジニアリングのスキルを身につけることで、大規模言語モデル（LLMs）の能力と限界をより理解することができます。研究者は、プロンプトエンジニアリングを使用して、質問応答や算術推論などの一般的なおよび複雑なタスクのLLMsの能力を向上させます。開発者は、LLMsやその他のツールとのインタフェースとなる強固で効果的なプロンプテクニックを設計するためにプロンプトエンジニアリングを使用します。プロンプトエンジニアリングは、プロンプトの設計と開発に限らず、LLMsとのインタラクションおよび開発に役立つ幅広いスキルと技術を含みます。これは、LLMsとインタフェースすること、ビルドすること、能力を理解すること

ymzkey 2023/05/30

リンク

Research | Open Assistant

This page lists research papers that are relevant to the project. Table of ContentsReinforcement Learning from Human FeedbackGenerating Text From Language ModelsAutomatically Generating Instruction Data for TrainingUncertainty Estimation of Language Model OutputsEvidence-Guided Text GenerationReward Model OptimizationDialogue-Oriented RLHFReduce Harms in Language ModelsReinforcement Learning from

ymzkey 2023/04/27

リンク

大規模言語モデルのための強化学習｜npaka

以下の記事が面白かったので、軽く要約しました。・Reinforcement Learning for Language Models 1. はじめに「ChatGPT」とそれに続く「大規模言語モデル」(LLM)のリリースに伴い、「RLHF」の重要性が議論されました。しかし、なぜ「強化学習」が「教師あり学習」よりも言語モデルの学習に適しているのか疑問に思いました。「教師あり学習」 (Instructionチューニング) で十分ではないでしょうか？私は、ある程度納得のいく理論的な議論を思いつきました。そして、特にChatGPTのようなモデルには、強化学習のケースを支持するだけでなく、それを必要とする追加の論拠があることに気がつきました。この追加の議論は、OpenAIのJohn Schulmanによる講演の（前半部分で）綴られています。この投稿は、彼の主張をより多くの言葉で繰り返し、また、明確

ymzkey 2023/04/25

リンク

http://arxiv.org/pdf/2210.11610

ymzkey 2023/04/11

大規模言語モデルの自問自答による回答精度向上

リンク

大規模言語モデルと外部リソースとを融合させたアプリケーションを作ろう－langchainのご紹介－ - Qiita

はじめに近年、深層学習を用いた自然言語処理技術の進展が目覚ましいです。その中でも、GPT-3をはじめとする大規模言語モデル（LLM）には大きな可能性を感じています。最近ですと、AI 技術者以外にも大きなインパクトを与えたChatGPTが記憶に新しいでしょう。今後もLLMの進化は止まらないと予想されており、私たちもどうやって活用するかを具体的に検討すべきフェーズに入ったのではないでしょうか。しかし、LLMを実業務に適用するとなると、越えなければならない課題がいくつも出てきます。今回は、以下にあげた第2・第3のハードルを越えるために役立つlangchainというライブラリをご紹介します。第1のハードル：機密データの扱い LLMはOpenAPIのGPT-3等、モデル自体は公開されておらずWebAPIだけが提供されているというパターンが多いです。そのため、機密データを社外に送信すると

ymzkey 2023/04/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

LargeLanguegeModelに関するymzkeyのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス