kybernetesのブックマーク - はてなブックマーク

ご家庭のパソコンで言語モデルを微調整してGPT-4を超える
１．ご家庭のパソコンで言語モデルを微調整してGPT-4を超えるまとめ・chatGPTのように言語を流暢に扱う事のできるAIを様々な企業や団体が公開してくれているがカスタマイズするには高性能なパソコンが必要であった・量子化(quantization)およびパラメータ効率の良い微調整(Parameter-Efficient Fine-Tuning)によりミドルスペックのパソコンでも動かせるようになった・量子化後、独自データを作成して量子化モデルにPEFTを行ったところ独自ベンチマークでgpt-4のスコアを上回る微調整モデルを作成する事ができた２．自分専用にカスタマイズしたチャットボットをミドルスペックPCで動かす chatGPTのおかげで大規模言語モデル(LLM:Large Language Model)という言葉が注目を集めるようになりました。 chatGPTのように言語を流暢に扱う
kybernetes 2023/12/16
LLM
リンク
日英・英日機械翻訳モデルALMA-7B-Ja-V2の公開
１．日英・英日機械翻訳モデルALMA-7B-Ja-V2の公開まとめ・先日公開した日英・英日機械翻訳モデルALMA-7B-Jaの性能を更に向上したV2を公開・70億パラメーターモデルだがMETA社の540億パラメーターモデルに近い性能を達成・量子化を行いサイズを縮小したGPTQ版の性能もかなり向上し、より扱いやすくなった２．日英・英日機械翻訳モデルALMA-7B-Ja-V2とは？ ALMA-7B-Jaは最近話題のchatGPTが使っているAI テクノロジー(LLM:大規模言語モデル)を使って学習させた日英・英日機械翻訳用のAIモデルです。chatGPTのように多様な機能を学習させるのではなく、翻訳機能に特化させる事で専門性を高める事を狙っています。先日、前バージョンである日英・英日機械翻訳AIモデルALMA-7B-Jaを公開したのですがまだまだ改善できる点が沢山ある事がわかっており、
kybernetes 2023/11/06
リンク
1

はてなブックマーク

タグ

ブックマーク / webbigdata.jp (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / webbigdata.jp (2)

ご家庭のパソコンで言語モデルを微調整してGPT-4を超える

日英・英日機械翻訳モデルALMA-7B-Ja-V2の公開

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス