gpt-indexは長いコンテキストに対してQAを行えるフレームワークです。 デフォルトではOpenAIのAPIを利用するので無邪気に長いコンテキストに質問を投げているとすぐ数$の請求になって焦りますね。 今回はローカルでオープンな日本語モデルを使って動かす方法をご紹介します。 あくまで試みであり、正答率もいまひとつで実用性があるものではありませんが、学習データセットを作るコード、モデル学習コード、gpt-indexを実行するコードはこのリポジトリに置いています。 https://github.com/oshizo/gpt_index_japanese_trial 1/18のツイートで投稿したツリーをもう少し詳しく説明する内容です。 gpt-indexをOpenAIなし&日本語で動かしてみています。かなりカスタマイズ性がある。 embed_modelとllm_predictorにローカルの