タグ

開発とGPUに関するmohnoのブックマーク (4)

  • 予算30万円台の深層学習用PCの買い方|shi3z

    深層学習をまじめにやるなら、どう考えても専用のPCが必要になる。 僕は現在、Memeplexというサービスを運営していて、これはさくらインターネットさんから大量のGPUを借りている。借りたGPUは、さくらインターネットの石狩データセンターで動いている。 さらに、ABCIは企画の段階から立ち会って、実際に仕事ではよく使っている。ABCIは5000以上のGPUを擁するGPUクラウド基盤で、その実態はスーパーコンピュータである。 ABCIを使えば、ほとんどの難しいタスクを恐ろしく安い料金で行うことができる。GoogleAmazon AWSのようなサービスを展開することができない邦においては、国家が設立し、民間利用可能なABCIは国民にとっての天叢雲剣あめのむらくものつるぎである。 それでもなお、手元には深層学習用のPCが必要だ。しかも一台では足りない。 ABCIがいかに安くても、PCほどの利

    予算30万円台の深層学習用PCの買い方|shi3z
    mohno
    mohno 2022/11/14
    機械学習しないから高性能GPUは使ってないけど、まともな開発者なら、その人件費を思えば、パソコンに30~40万くらいかけていいよね。資産会計が面倒になるからと安いパソコン使わされてるのはかわいそうというか。
  • Linuxの生みの親トーバルズ氏の最新自作マシンを徹底解剖--本人のコメント付きで構成を紹介

    Steven J. Vaughan-Nichols (Special to ZDNET.com) 翻訳校正: 石橋啓一郎 2020-07-04 08:30 Linuxの生みの親であるLinus Torvalds氏は5月、Linuxカーネルメーリングリスト(LKML)で、次期バージョンである「Linux 5.7-rc7」の最近の開発状況について説明した。同氏はその中で、「15年ぶりに自分のデスクトップをIntelベースではないマシンにした」と述べている。最新の開発用マシンには、「AMD Threadripper 3970X」が搭載されているという。しかし、CPUがどれだけ高速でも、コンピューターの性能はそれだけでは決まらない。筆者は同氏にインタビューして、新マシンの詳しい構成を聞いてみることにした。 まず、同氏は既に新しいマシンのパフォーマンスに感動しているという。 「『allmodconf

    Linuxの生みの親トーバルズ氏の最新自作マシンを徹底解剖--本人のコメント付きで構成を紹介
    mohno
    mohno 2020/07/04
    良い趣味してますね、感。「GPUについてはそれほど気にしていないので、内蔵のもので十分」「サムスンのSSD」「M.2規格」「4つのメモリーチャネルは全部埋めたかった」「同氏が使っているノートPCは「Dell XPS 13」」
  • DirectX ❤ Linux - DirectX Developer Blog

    DirectX is coming to the Windows Subsystem for Linux At //build 2020 we announced that GPU hardware acceleration is coming to the Windows Subsystem for Linux 2 (WSL 2). What is WSL? WSL is an environment in which users can run their Linux applications from the comfort of their Windows PC. If you are a developer working on containerized workload that will be deployed in the cloud inside of Linux co

    DirectX ❤ Linux - DirectX Developer Blog
    mohno
    mohno 2020/05/20
    "coming to the Windows Subsystem for Linux 2"←「Linux」じゃなくて「the Windows Subsystem for Linux」で動く、ということなのか(?)。そういう需要、どれくらいあるの?
  • 秒速で10億レコードを処理する話 - KaiGaiの俺メモ

    これまでのPG-Stromの性能測定といえば、自社保有機材の関係もあり、基的には1Uラックサーバに1CPU、1GPU、3~4台のNVME-SSDを載せた構成のハードウェアが中心だった。*1 ただソフトウェア的にはマルチGPUやNVME-SSDのストライピングに対応しており、能力的にどこまで伸ばせるのかというのは気になるところである。 そこで、方々に手を尽くして、次のようなベンチマーク環境を整備してみた。 (機材をお貸し頂いたパートナー様には感謝感激雨あられである) 4UサーバのSYS-4029GP-TRTというモデルは、GPUをたくさん乗っけるためにPCIeスイッチを用いてPCIeスロットを分岐している。ちょうど、PCIeスイッチ1個あたり2個のPCIe x16スロットが用意されており、同じPCIeスイッチ配下のデバイス同士であれば、完全にCPUをバイパスしてPeer-to-Peerのデ

    秒速で10億レコードを処理する話 - KaiGaiの俺メモ
    mohno
    mohno 2019/11/01
    この辺疎くて素朴な疑問なんだけど、これって「毎秒17.1億行を処理」してるの?(レコード数を1万分の1にしたら、時間は1万分の1になるの?というか)
  • 1