sonotsのブックマーク - はてなブックマーク

Tensorコアを使ってみた - Fixstars Tech Blog /proc/cpuinfo

このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。アルバイトの大友です。 TensorコアのWMMA APIを使っている人があまりいなかったため、6月中はインターンとして、7月からはアルバイトとしてその使い方や性能を調べていました。この記事はその成果をまとめたものです。 Tensorコアを使うことでFP16のSIMD計算(f16x2)に比べ密行列積を5倍程度高速化できました。 Tensorコアとは NVIDIA Voltaアーキテクチャから採用されたTensorコアは2つの$4 \times 4$のFP16行列の積を1サイクルで計算し、その累積和をFP16/FP32で取ることができる計算ユニットです。 cuBLAS, cuDNNなどのライブラリではCUDA 9からTensorコアを利用できます。 WMMA APIを用いた行列積計算

sonots 2018/10/11

CUDA C++ の WMMA API で Tensor コアを使ったプログラミングを cuBLAS や cuDNN 経由ではなく直接できる

リンク

CuPyをOpenCLで動かすフレームワーク ClPy がベータ版になりました - Fixstars Tech Blog /proc/cpuinfo

本日、フィックスターズは、CuPyをOpenCLでも使えるようにした「ClPy」のベータ版であるv2.1.0beta0を公開しました！前回、6月にα版として先行リリースしたclpyは、今日からベータ版となり、アルファ版では不十分だった多くの機能を拡充しました。具体的には、以下のような機能が追加されました。 ChainerのImageNet exampleが動くようになりました。これまではMNISTなどの小さいアプリでしか動作しませんでしたが、今回のバージョンからはもう少し実用的な深層学習もできるようになりました。 CUDA C++を元にOpenCL Cのカーネルを生成する、新しい生成器を作成しました。この機能により、従来よりより多くのUser defined custom kernelがClPyでも動作できるようになりました。例えば、今まではChainerのexamplesを動かすには

sonots 2018/08/23

リンク

CuPyをOpenCLで動かすフレームワーク ClPy を先行リリースしました - Fixstars Tech Blog /proc/cpuinfo

本日、フィックスターズは、PythonからNVIDIA GPUを使うためのライブラリCuPyをOpenCLでも使えるようにしたClPyをGitHubにて公開しました！ ClPyを使えば、例えばChainerのようなニューラルネットを用いた機械学習を、OpenCLが動くデバイス（例えばAMD Radeonなど）でも動作させることができるようになります。詳細 CuPyとは、Python上での数値計算におけるで事実上の標準となっているNumPy互換でCUDAを使ったGPGPUが利用できるようにするためのライブラリです。もともとCuPyは、Preferred Networksさんが作っているChainerというニューラルネット用フレームワークをCUDAで動かすためのバックエンドとして統合されていました。現在では分離・独立して、Preferred Networksさん主体で「NumPy互換で動く」

sonots 2018/06/07

お

リンク

ニューラルネットの共通フォーマット対決！ NNEF vs ONNX - Fixstars Tech Blog /proc/cpuinfo

このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。遠藤です。ニューラルネット界隈では、Caffe、TensorFlow、Chainer をはじめ、数々のフレームワークが群雄割拠の様相を呈しております。弊社でも、プロジェクトに応じて適宜フレームワークを使い分け、日々の業務にあたっております。多数のフレームワークを扱っていると「あっちのフレームワークで学習したモデルを、こっちのフレームワークで使いたい！」といった、フレームワーク間をまたいでモデルを共有したいというニーズが出てきます。そのために、フレームワーク間で共通して使える交換フォーマットが開発されるようになりました。そこで、今回はニューラルネットの共通フォーマットとして NNEF と ONNX の2つをご紹介したいと思います。 NNEF とは？概要 NNEF – Neural

sonots 2018/04/20

リンク

イベントレポート：FPGAエクストリーム・コンピューティングで「Halideでつくる、Domain Specific Architectureの世界」というタイトルで発表してきました - Fixstars Tech Blog /proc/cpuinfo

Use dedicated memories to minimize the distance over which data is moved. Invest the resources saved from dropping advanced microarchitectural optimizations into more arithmetic units or bigger memories. Use the easiest form of parallelism that matches the domain. Reduce data size and type to the simplest needed for the domain. Use a domain-specific programming language to port code to the DSA.

sonots 2018/03/10

リンク

第6回社内プログラミングコンテスト『量子リバーシ』開催 - Fixstars Tech Blog /proc/cpuinfo

[2018/01/10 アップデート] 社内プロコン説明書を第1.06版に更新しました。こんにちは。エンジニアの二木です。毎年開催しているフィックスターズ社内プログラミングコンテストですが、今年も開催されました。今回のお題は『量子リバーシ』です。開催期間は、今年の11月30日から来年の2月2日となっており、約2ヶ月ありますので、余裕をもって取り組めるのではないでしょうか。詳しい内容については社内プログラミングコンテストの説明(PDF)をご覧ください。量子リバーシとは、今回のコンテストのために作ったオリジナルのゲームのことです。弊社では今年から量子コンピューティングに力を入れていることもあり、量子をモチーフとして取り入れてみました。量子三目並べというゲームが既に存在するのですが、その量子に関するルールをリバーシ(オセロ)に取り入れて拡張したゲームになっています。単純な三目並べでも量

sonots 2017/12/13

これはww

リンク

CUDAをRadeonで動かす（導入編） - Fixstars Tech Blog /proc/cpuinfo

このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。みなさん、今日も元気にGPGPUしていますか？去年(SC15)の話ですが、「RadeonでCUDAが使えるようにするよ！」とAMDが発表したニュースを覚えている方いらっしゃいますでしょうか。Boltzmann Initiativeの話です。あれからしばらく時が流れ、機は熟しました。「CUDAはNVIDIA専用」そんな時期は今は昔。そう、CUDAをAMDのGPUであるRadeonで動かすことに成功しました！！ので、ここではその方法と、その時に使ったコードを紹介したいと思います。予めお断りしておくと、表題にもある通り、今回は導入編ということで「動くことを確認する」までになります。そのうち時間を見つけて「性能測定編」もやってみたいと思いますが、ぜひこれを読んだ方、ぜひ性能測定してみ

sonots 2017/06/06

動くのか

リンク

はてなブックマーク

タグ

ブックマーク / proc-cpuinfo.fixstars.com (7)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス