aquaricknのブックマーク / 2023年12月9日

LLMの根幹「Transformer」とは？並列処理に最適なワケ

22 users
xtech.nikkei.com
テクノロジー

2017年にGoogleの研究者が提唱した深層学習モデルで、チャットAI「Chat GPT」などに使われる。「どこに注目するか」を重視したことで、自然言語処理での精度や処理速度を大幅に高めた。米OpenAIの「ChatGPT」は2022年に公開されるやいなや、その精度の高さに世界が衝撃を受けた。このChatGPTは、同社の大規模言語モデル（LLM）「GPT（Chat Generative Pre-trained Transf ormer）」をベースにしている。Transf ormerこそ、LLMの根幹である。 Transf ormerはエンコーダー（符号器）とデコーダー（復号器）で構成し、「どこに注目するか」を重視するアテンション機構を中心としている。大規模並列処理に向いたモデルで、GPUでの処理を想定して設計した。 Transf ormerは米Google Brain（現在の米Google D

はてなブックマーク

タグ

2023年12月9日のブックマーク (1件)

LLMの根幹「Transformer」とは？並列処理に最適なワケ

お知らせ

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

今週のはてなブックマーク数ランキング（2024年10月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス