タグ

spaCyとchatGptに関するmanboubirdのブックマーク (2)

  • ChatGPTのコンテキストを英語要約の文書ベクトルで作る|ふたたか

    先日こちらの記事を書いたのですが、コンテキストのウィンドウが4096トークンしかない問題があり、あまり良い結果が得られませんでした。 そこで改善策として、次の点を実施してみました。 記事を要約することで、コンテキストに詰め込める情報量を増やす。 英語に翻訳する。日語に比べるとトークン数が半減する。また、英語の方が精度が上がる。 ドキュメントを要約&翻訳する今回もライブドアニュースを使用します。 openai.ChatCompletion.create()を使用して要約します。出力は英語になります。 プロンプトは以下のようになります。要約後のトークンが4096になるようにします。 {"role": "system", "content": '''summarize this document for me and keep the summary to around less than 4

    ChatGPTのコンテキストを英語要約の文書ベクトルで作る|ふたたか
  • ベクトル検索エンジンでChatGPTのコンテキストを作る方法|ふたたか

    はじめにChatGPTの問題に、2021年までのデータでしか学習しておらず、最新の情報に答えることができないことがあります。例えば昨日の東京の天気を教えてと、小学生でも分かる質問にすら答えることができません。また、インターネットに公開していない情報、例えば企業の内部情報や個人のプライベートな情報にも無力です。人間もそうですが、人工知能と言えど知らないことは知らないのです。 その問題の解決策の一つにファインチューンがあります。自社データを持ち込み学習モデルの微調整を行う方法です。つい先日、Azure版のgpt-3.5 turboのファインチューンがサポートされました。ただこの方法はお金もかかりますし、Azure環境を利用するなど敷居が高いです。 そこでブログでは、ベクトル検索エンジンを併用した、お手軽で低コストにChatGPTを賢くする方法をご紹介したいと思います。 この方法ではプロンプト

    ベクトル検索エンジンでChatGPTのコンテキストを作る方法|ふたたか
  • 1