1. データ拡張生成「データ生成拡張」は、特定のデータに基づいて言語モデルでテキスト生成する手法です。 言語モデルは、大量の非構造化データで学習しているため、汎用のテキスト生成に最適ですが、特定のデータに基づいてテキスト生成したい場合も多くあります。 データ生成拡張が必要になる場合は、次のとおりです。 ・特定のテキストの要約 (Webサイト、プライベートな文書など) ・特定のテキストに対する質問応答 (Webサイト、プライベートな文書など) ・複数のテキストに対する質問応答 (複数のWebサイト・プライベートな文書など) ・APIの外部呼び出しの結果の使用 (SQLクエリ結果など) 2. インストールGoogle Colabでのインストール手順は、次のとおりです。 (1) パッケージのインストール。 データ拡張生成のために「faiss」もインストールします。 # パッケージのインストール