タグ

VRAMとAIに関するdiet55のブックマーク (2)

  • 完全フリーで3GBのVRAMでも超高速に動く14B大規模言語モデルRWKVを試す|shi3z

    Transformerは分散できる代償として計算量が爆発的に多いという不利がある。 一度みんなが忘れていたリカレントニューラルネットワーク(RNN)もボケーっとしている場合ではなかった。 なんと、GPT3並の性能を持つ、しかも完全にオープンな大規模言語モデルが公開されていた。 そのなもRWKV(RuwaKuvと発音しろと書いてある。ルワクフ?) RWKVはRNNなのでGPUメモリをそれほど大量に必要としない。 3GBのVRAMでも動くという。 時間がない方はビデオをご覧ください 僕の失敗は、何も考えずにgit lfs installでディレクトリごとコピーしようとしたこと。 このディレクトリには過去のモデルデータが全部あるので、ひとつ30GBのモデルデータを何十個もダウンロードしようとしていて終わらなかったのだ。 モデルデータは一とつあれば十分なのでひとつだけにする。 次に、chatのリポ

    完全フリーで3GBのVRAMでも超高速に動く14B大規模言語モデルRWKVを試す|shi3z
    diet55
    diet55 2023/03/27
    「ちなみにMacBookPro M2 MAX(32GB)でやると、一単語を生成するのに2分くらいかかるのでGPUはやはりあった方が良さそう。」 「huggingfaceで試したところ、かなりのスピードで動作する」
  • 予算30万円台の深層学習用PCの買い方|shi3z

    深層学習をまじめにやるなら、どう考えても専用のPCが必要になる。 僕は現在、Memeplexというサービスを運営していて、これはさくらインターネットさんから大量のGPUを借りている。借りたGPUは、さくらインターネットの石狩データセンターで動いている。 さらに、ABCIは企画の段階から立ち会って、実際に仕事ではよく使っている。ABCIは5000以上のGPUを擁するGPUクラウド基盤で、その実態はスーパーコンピュータである。 ABCIを使えば、ほとんどの難しいタスクを恐ろしく安い料金で行うことができる。GoogleAmazon AWSのようなサービスを展開することができない邦においては、国家が設立し、民間利用可能なABCIは国民にとっての天叢雲剣あめのむらくものつるぎである。 それでもなお、手元には深層学習用のPCが必要だ。しかも一台では足りない。 ABCIがいかに安くても、PCほどの利

    予算30万円台の深層学習用PCの買い方|shi3z
    diet55
    diet55 2022/11/14
    「金利無料(略)貯金してから買ってはダメだ(略)AIの扱いに習熟した上で稼げば30万どころじゃない」「RAMDISKは、ハッキリ言って最強」「米大手IT企業のクラウドのGPU(略)その人はあんまり真面目にGPU使ってない人」
  • 1