1. データ拡張生成「データ生成拡張」は、特定のデータに基づいて言語モデルでテキスト生成する手法です。 言語モデルは、大量の非構造化データで学習しているため、汎用のテキスト生成に最適ですが、特定のデータに基づいてテキスト生成したい場合も多くあります。 データ生成拡張が必要になる場合は、次のとおりです。 ・特定のテキストの要約 (Webサイト、プライベートな文書など) ・特定のテキストに対する質問応答 (Webサイト、プライベートな文書など) ・複数のテキストに対する質問応答 (複数のWebサイト・プライベートな文書など) ・APIの外部呼び出しの結果の使用 (SQLクエリ結果など) 2. インストールGoogle Colabでのインストール手順は、次のとおりです。 (1) パッケージのインストール。 データ拡張生成のために「faiss」もインストールします。 # パッケージのインストール
![LLM連携アプリの開発を支援するライブラリ LangChain の使い方 (2) - データ拡張生成|npaka](https://cdn-ak-scissors.b.st-hatena.com/image/square/24c03a8ec8a94e2af50b32c907f2591e1e432ad7/height=288;version=1;width=512/https%3A%2F%2Fassets.st-note.com%2Fproduction%2Fuploads%2Fimages%2F94120526%2Frectangle_large_type_2_c5c50376376a74d640fcc2e1eb509e8b.png%3Ffit%3Dbounds%26quality%3D85%26width%3D1280)