CPUに関するtomerunのブックマーク (15)

  • なぜcuDNNのConvolutionは高速なのか | 射撃しつつ前転

    cuDNNはNVIDIAが公開しているDeep Learning用のライブラリである。このライブラリを使うとCaffeやChainerなどのDeep Learning用のソフトウェアの速度が向上する。 この速度向上に寄与している最も大きな部分がConvolutionの高速化である。 個人的には、CPUでどこまで高速にConvolutionが実現できるのかに興味がある。記事は、その準備段階として、どういう高速化戦略がありえるのかを調べたものである。 ConvolutionとはConvolutionは、日語では畳み込みと呼ばれる操作である。畳み込み操作自体は何次元のデータ構造に対しても定義できるが、以下では、画像処理でよく使われる、二次元のConvolutionのみを考える。 何も考えずに普通にConvolutionを実装すると、以下の擬似コードのようになるだろう。ただし、簡単のため、境界

    tomerun
    tomerun 2016/03/12
  • 「ポストムーアに向けた計算機科学・計算科学の新展開」シンポジウム

    1960年代に米インテル社の創業者ムーアが唱えた「ムーアの法則(LSI上の複雑さ≒トランジスタ数は毎年指数的に増加する)」によるCPU性能の指数的な向上がこの数十年間持続され,科学技術の発展,社会インフラの充実に大きく貢献してきました。 しかし,近年リソグラフィーの微細化技術に限界,形成されるトランジスタの微細化による物性的問題等が相俟って,ムーアの法則が2025-2030年頃に終焉すると予測されています。 それはトランジスタあたりの電力が一定となり,計算性能(FLOPS)の伸びが停止することを意味しています。 そのようなポスト・ムーア時代において高性能計算技術の持続的発展を図るためには,幅広い分野の専門家の緊密な協力の下に,現状のスパコンに代表される計算性能(FLOPS)中心の性能向上技術からデータ移動(BYTES)中心に転換する新たな体系を築くことが必要です。 シンポジウムでは,国内

    tomerun
    tomerun 2016/03/05
  • GCC -O0、-O1、-O2、-O3、-Ofast 高速化比較

    The GNU Compiler Collection includes front ends for C, C++, Objective-C, Fortran, Java, and Ada, as well as libraries for these languages. 2月28日(米国時間)にPhoronixに掲載された記事「GCC Optimization Level Benchmarks With A 4GHz Intel Skylake CPU On Ubuntu 64-bit」が、GCC 5.3.1における最適化オプションの違いによるベンチマーク結果の違いを掲載した。それぞれ「-O0」「-O1」「-O2」「-O2 -march=native」「-O3」「-O3 -march=native」「-Ofast」「-Ofast -march=native」を指定してビルドしたバイナ

    GCC -O0、-O1、-O2、-O3、-Ofast 高速化比較
    tomerun
    tomerun 2016/03/02
  • 【後藤弘茂のWeekly海外ニュース】 20年後の今も至る所で生き残っているPentiumアーキテクチャ

    tomerun
    tomerun 2015/06/13
  • Intel® Intrinsics Guide

    Using Intel.com Search You can easily search the entire Intel.com site in several ways. Brand Name: Core i9 Document Number: 123456 Code Name: Emerald Rapids Special Operators: “Ice Lake”, Ice AND Lake, Ice OR Lake, Ice* Quick Links You can also try the quick links below to see results for most popular searches. Product Information Support Drivers & Software

    Intel® Intrinsics Guide
    tomerun
    tomerun 2014/04/29
  • ハイパーバイザの作り方

    「ハイパーバイザの作り方」公開ページ こちらのページはSoftware Design誌の連載記事「ハイパーバイザの作り方」の公開ページです。 「Linuxのしくみを学ぶ - プロセス管理とスケジューリング」も公開中ですので、こちらも是非ご覧ください。 公開中の記事 第1回 x86アーキテクチャにおける仮想化の歴史とIntel VT-x [HTML] [PDF] [ePub] [mobi] [Kindle] 第2回 Intel VT-xの概要とメモリ仮想化 [HTML] [PDF] [ePub] [mobi] [Kindle] 第3回 I/O仮想化「デバイスI/O編」 [HTML] [PDF] [ePub] [mobi] [Kindle] 第4回 I/O仮想化「割り込み編・その1」 [HTML] [PDF] [ePub] [mobi] [Kindle] 付属資料 最近のPCアーキテクチャにお

    tomerun
    tomerun 2014/04/23
  • NaCl について - 2013-12-18 - 兼雑記

    カーネル/VM Advent Calendar 2013 にさっき登録しました。需要の無さそうな NaCl について語ります。 https://qiita.com/advent-calendar/2013/kernelvm NaCl はグーグルが作ったものの中で一番好きくらいに好きなものです。理由は低レイヤコンポーネント集だから。概要としては安全に実行できる(ここでいう安全はブラウザが動いてる OS 上での任意コード実行ができない、という意味) Active X というか、 C/C++ でコードが書ける Java Applet というか、まぁそういう感じの。 NaCl はおおざっぱに言って、 検証可能なバイナリを出力するコンパイラツールチェイン (gcc, binutils, etc.) ユーザプログラムを検証して起動する service runtime service runtime と

    NaCl について - 2013-12-18 - 兼雑記
    tomerun
    tomerun 2014/01/18
  • ArmとCortex | APS|組み込み業界専門メディア

    Armの歴史Armの誕生Armは、当初(1983年~85年ごろ)、英国ケンブリッジのAcorn Computers Limitedで開発されました。それは商用に開発された最初のRISCマイクロプロセッサです。1990年Advanced RISC Machines Limitedは、Armテクノロジの利用拡大を目的に設立されました。以来、Armは世界中の多くの半導体メーカにライセンスされています。 当時、Acorn Computers Limited で働いていたエンジニアの話によると、Advanced RISC Machines Limited設立の発表は、何が起こったのか、すぐには理解できなかったそうです。とにかく「何か大きな変革が起きたみたいだ」と感じたそうで、時間が経つにつれて、現実が把握できたそうです。 RISCマイクロプロセッサと言うのは、後ほど詳しく説明いたしますが、簡単に言う

    ArmとCortex | APS|組み込み業界専門メディア
    tomerun
    tomerun 2013/12/08
  • rpi_start.Sを読む (第1回) - BSD小僧の日記

    ARMアセンブリ言語を勉強するため、CPUのスタートアップを題材にソースコードを読んでみようと思います。 といっても、ARMアセンブリ言語の知識は皆無なので、Webで一命令ずつ調べながら、わからないところは大胆に飛ばしながら読んでいくという無責任企画です。 今話題のRaspberry Piをターゲットに、少しづつ勉強していきます。 src/sys/arch/evbarm/rpi/rpi_start.Sの1.7がターゲットになります。コメント含めて328行の小さなプログラムですが、自分にとっては楽しめそうです。 さて、はじめましょう。 一番最初に実行されるエントリーポイントから読んでいきます。ソースの最初の部分は少し飛ばして、122行目からスタートです。 122 .global _C_LABEL(rpi_start) 123 _C_LABEL(rpi_start): ラベルですね。_Cとつい

    tomerun
    tomerun 2013/11/10
  • ASCII.jp:ロードマップでわかる!当世プロセッサー事情(大原雄介)

    多くの新製品が世に送り出されるプロセッサーの世界。テクニカルライターの大原雄介氏による連載では、CPUGPUなどコンピューターの中核となるプロセッサーのロードマップを軸に、その変遷を解説していく。 2024年06月10日 12時00分 PC 第775回 安定した転送速度を確保できたSCSI 消え去ったI/F史 SCSIは「まだ使っている」ユーザーがいるだろう。筆者の手元にも若干機材が残っているが、市場としてはほぼ壊滅している感が強い。 2024年06月03日 12時00分 PC 第774回 日の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 Esperanto Technologyが第3世代製品をRapidusの2nmプロセスを利用して製造することを明らかにした。発表会の内容をもとにET-SoC-2/ET-SoC-3の詳細を説明

    ASCII.jp:ロードマップでわかる!当世プロセッサー事情(大原雄介)
  • INTEL コード & ダウンロード

    tomerun
    tomerun 2013/10/28
  • How a CPU is made

    How a CPU is Made - CPU Manufacturing Central Processing Unit #CPU Global Foundries shows how a CPU is made with all major steps of the process. Source: http://www.globalfoundries.com/ Subscribe Here because amazing videos will come soon: http://www.youtube.com/user/benyamin225?sub_confirmation=1 How a CPU is made how to make CPU make cpu how cpu made CPU How a CPU working from sand to CPU m

    How a CPU is made
    tomerun
    tomerun 2013/10/21
    かっこいい
  • ARM Information Center

    tomerun
    tomerun 2013/09/22
  • Intel Xeon 3.6 GHz - RK80546KG1042MM / NE80546KG1042MM / BX80546KG3600FA

    tomerun
    tomerun 2013/05/17
    TopCoderサーバーCPU
  • x86/x64最適化勉強会5 レポート - Cybozu Inside Out | サイボウズエンジニアのブログ

    こんにちはサイボウズ・ラボの光成です。 今回は3月30日に開催された「x86/x64最適化勉強会5」の模様についてお伝えします。 x86/x64最適化勉強会会場 プログラム開発においては、開発の段階において早すぎる最適化は悪、当に必要になってから最小限だけ行いなさいと言われています。 また今どきのコンパイラは優秀なので、下手な小細工はせずにコンパイラに任せておくのがよいとも言われています。 もちろん一般的にはそれは正しいのですが、普段動画や音声を利用するときに使われているコーデック、ネット上での決済時に利用される暗号ライブラリなどは、人の手によるアセンブリ言語で開発されていることが多いのもまた事実です。 私が主催しているこの勉強会はそういう下回りのライブラリを開発するときに必要な技術や情報の交換のために行っています。 ustreamで過去の会の動画も含めてみることができます。 以下、やや

    x86/x64最適化勉強会5 レポート - Cybozu Inside Out | サイボウズエンジニアのブログ
  • 1