パフォーマンス改善 この間、GPUでニューラルネットワークを更新しましたが、その実装は適当でした。 遅いのです。 その実装を流用して制限付きボルツマンマシン(Restricted Boltzmann Machine : RBM)を実装した所、CPUより遅いというありさまでした。 今回はパフォーマンスを改善したやり方でニューラルネットワークの更新をしてみようと思います。 と言っても中身はただのマトリクスとベクトルの乗算です。 他にも流用できそうですね。 [0回] GPUで擬似乱数 DirectX11を使ってGPUで擬似乱数を生成したので、今度はOpenCLで同じことをやってみます。 Program.cs using System.Linq; using Cloo; struct Xorshift128RandomGpu { public int w, x, y, z; public Xors