[B! fastertransformer] dannのブックマーク

dann id:dann

fastertransformerに関するdannのブックマーク (4)

Accelerated Inference for Large Transformer Models Using NVIDIA Triton Inference Server | NVIDIA Technical Blog
dann 2023/05/17
trition

nvidia

fastertransformer
リンク
Surpassing NVIDIA FasterTransformer’s Inference Performance by 50%, Open Source Project Powers into the Future of Large Models Industrialization
dann 2023/05/17
fastertransformer

triton
リンク
はじめての自然言語処理 Transformer 系モデルの推論高速化の検証 | オブジェクトの広場
今回は Transf ormer 系のモデル、具体的には BERT, T5, GPT の推論を高速化してみます。高速化手法として FasterTransf ormer, Torch-TensorRT, AWS Neuron を用い、素の transfomers に比べ、どの程度速くなるか（ならないか）、利点・欠点を確認してみましょう。 1. はじめに今回は Transf ormer 系のモデル、具体的には BERT, T5, GPT の推論を様々な技術を使って高速化してみます。高速化の元ネタは Hugging Face の transf ormers1 縛りとして、素の transf ormers で推論する場合に比べ、どの程度速くなるか（ならないか）見てみましょう。推論を高速化する技術としては FasterTransfomer2, Torch-TensorRT3, AWS Neuron(
dann 2023/05/17
transformer

fastertransformer

triton
リンク
GitHub - NVIDIA/FasterTransformer: Transformer related optimization, including BERT, GPT
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.
dann 2023/04/23
transformer

inference

deeplearning

triton

fastertransformer
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx