ブックマーク / note.com/3d_vizionist (1)

  • 速報:話題の 1ビットLLMとは何か?|寺田英雄(㈱オープンストリームCTO)

    2024-02-27にarXiv公開され,昨日(2024-02-28)あたりから日AI・LLM界隈でも大きな話題になっている、マイクロソフトの研究チームが発表した 1ビットLLMであるが、これは、かつてB-DCGAN(https://link.springer.com/chapter/10.1007/978-3-030-36708-4_5; arXiv:https://arxiv.org/abs/1803.10930 )という「1ビットGANのFPGA実装」を研究していた私としては非常に興味をそそられる内容なので、論文を読んでみた。今回は速報として、その内容のポイントを概説したい。 論文情報 Ma, S. et al. (2024) ‘The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits’, arXiv [c

    速報:話題の 1ビットLLMとは何か?|寺田英雄(㈱オープンストリームCTO)
    samu_i
    samu_i 2024/03/03
    “「あらゆる機械がしゃべりだす」時代が、ぐっと近づいたのである。” そのドラえもん、物まねマシンでしかないの、なんかなぁ
  • 1