note.com[B!]新着記事・評価 - はてなブックマーク

『note.com』

local llmでsentence embeddingどれ使えば良いんだっけ｜if001
6 users
note.com/if001

最近の日本語喋れるLLMでそのままsentence embeddingしても良いんだっけ？そもそもどうやってsentence embeddingしてるんだっけ？と思っていたので調べてみた。単語単位のembeding実装はsentence tranfomerが参考になる。 sentence transfomerでない場合やbertのclsトークンを持たない場合は、単語embeddingを足し合わせて、単語列の長さで平均をとるmean_poolingがよく使われる手法らしい。追加でattentionのweightも加味すると良いみたい。 sentence transfomerではpoolingする層を最後に追加して、出力がembeddingされたvectorになる。 Flan-T5単語単位のembeddingしかできないが、mean_poolingを用いた場合が精度が良いらしい。 embe
- テクノロジー
- 2023/06/22 12:20

CTranslate2でrinna instructionをquantizeして動かす｜if001
3 users
note.com/if001

これまでquantizeはllama.cppを使っていたが、GPUを使えなかったのでCTranslate2を使ってみた。 CTranslate2はtransfomer modelのメモリを削減、高速化を行うライブラリ CTranslate2 is a C++ and Python library for efficient inference with Transformer models. https://github.com/OpenNMT/CTranslate2#ctranslate2C++で実装されており、pythonからC++を呼び出している。document通りinstallすると、GPUも利用してくれる。いろんなモデルが対応している Decoder-only models: GPT-2, GPT-J, GPT-NeoX, OPT, BLOOM, MPT, LLaMa, Co
- テクノロジー
- 2023/06/13 19:36

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx