zenn.dev[B!]新着記事・評価 - はてなブックマーク

『zenn.dev』

FastAPIでStreamingResponseに対応したrinna APIを作ってみる
3 users
zenn.dev/onaka_ga_pkpk

はじめに rinnaをサービスに組み込みやすくするためにapi化したけどやっぱりchatGPTみたいにストリーミングしたほうがユーザー体験が良いってことでStreamingResponseに対応したrinna APIを作ってみた。生成された出力をStreamingする方法 transformersのTextIteratorStreamerクラスを使えば良いらしい。使い方は簡単で TextIteratorStreamerにtokenzierを渡して tok = AutoTokenizer.from_pretrained("gpt2") model = AutoModelForCausalLM.from_pretrained("gpt2") inputs = tok(["An increasing sequence: one,"], return_tensors="pt") streame
- テクノロジー
- 2023/07/04 03:22

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx