"Locality is efficiency, Efficiency is power, Power is performance, Performance is King", Bill Dally マルチスレッディングとは? CPUとGPUのマルチスレッディングの違いをブログにまとめていたけど例によって誰も興味なさそう— arutema47 (@arutema47) 2021年8月16日 つぶやいたら読みたい方が多そうだったので完成させました。 マルチスレッディングとはメモリ遅延を隠蔽しスループットを上げるハードウェアのテクニックです。 ただCPUとGPUで使われ方がかなり異なるため、その違いについて考えてみる記事です。 (SIMDについて並列プログラミングの観点から触れるべきでしたが、時間無いマルチスレッディングに注目するため初版では省きました。) 本記事について 本記事はCPUとG
こんにちは、ハカルス 東京R&Dセンター所属のエッジ・エバンジェリスト 田胡治之です。この連載では、半導体業界で長年知識や情報を得てきた私、田胡がこれまでと異なるAI業界に飛び込み、そこから感じる業界のニュースやトピックを独自の視点で紹介したいと思います。 第4回のテーマはApple社の M1 プロセッサについてです.2020年11月に発表された同社MacBook Pro, MacBook Air, Mac mini に使われています.既に多くのサイトがベンチマークを行い,低消費電力かつ高性能に驚いています.本稿ではM1の高性能の謎解きを試みます. M1 プロセッサの性能 従来のIntel CPU搭載Macでは、CPU、メモリ、Apple T2、Thunderboltコントローラ、I/Oチップが別々となっていましたが、M1ではこれらすべてを統合しました.SiP技術を使いメモリをCPUと一つ
AMDのAthlonやZenマイクロアーキテクチャ、Apple A4など、数々のチップ開発に携わり、「天才エンジニア」と高い評価を受けているジム・ケラー氏が、人工知能(AI)チップのスタートアップであるTenstorrentの社長兼CTO(最高技術責任者)に就任したと報じられています。 MOVES-Former Intel, Tesla chip exec Jim Keller joins artificial intelligence startup | Reuters https://www.reuters.com/article/tenstorrent-tech-idUSL1N2JG2I6 Jim Keller Becomes CTO at Tenstorrent: "The Most Promising Architecture Out There" https://www.ana
(湯之上 隆:技術経営コンサルタント、微細加工研究所所長) インテルが微細化競争から脱落 世界半導体売上高1位であり、プロセッサメーカーのチャンピオンである米インテルは2016年、10nmプロセス(以下、プロセスは省略)の立ち上げに失敗した。その後、インテルは何度も「今度こそ10nmが立ち上がる」という発表を繰り返してきたが、現在に至るまで、それは実現していない。そのため、2015年以降、14nmを延命し続けている(図1)。 これに対して、半導体製造を専門とする台湾のファンドリーのTSMCは、2018年に7nmを立ち上げ、2019年には最先端露光装置EUV(Extreme Ultraviolet)を使った7nm+による量産を開始した。今年2020年には、5nmが立ち上がっており、来年2021年には3nmによる量産を始める。 また、メモリのチャンピオンである韓国のサムスン電子も、2030年ま
キャー @naoya_ito サーン!! (今から講演会— sylph01 (@s01) 2015年5月20日 Access でなんか講演してくれという話で小一時間エモい話したけど、質疑応答が #rebuildfm リスナーからの SHIROBAKO とかゼノブレイドクロスとかの質問で草— Naoya Ito (@naoya_ito) 2015年5月20日 「rebuild.fmの人」やTwitterの@記法の名前もそうなんですがヘビーはてなユーザーの私としてはやっぱりid記法で呼びたい id:naoya さん(伊藤直也さん)の新卒向け講演が社内で行われたのでまずは講演記録パートです。本名と所属は以前から「がんばればわかる」ようになってますし*1、出して困るような厄介な人は幸い身近にいないので身バレとか知らない。 以下長いので続きを読む記法で。感想パートは1日以内に別記事で更新します。 「
こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、ニューラルネットワークの量子化の話をします。 TL;DR パラメータだけを量子化するのであれば、ほぼ精度を落とさずに、パラメータのデータ容量は1/16程度にまで削減できる パラメータ、アクティベーション、勾配のすべてを量子化し、推論だけでなく学習までもビット演算だけで実現する研究が進んできている 現在は深層学習 = GPU必須というぐらいの勢いがあるけど、量子化の研究が進むと、今後はどうなるかわからないよ はじめに 情報理論における量子化とは、アナログな量を離散的な値で近似的に表現することを指しますが、本稿における量子化は厳密に言うとちょっと意味が違い、十分な(=32bitもしくは16bit)精度で表現されていた量を、ずっと少ないビット数で表現することを言います。 ニュ
こんにちわ。せじまです。今年に入ってからアクティビティトラッカーを二回壊しまして、新しい分野の製品って設計いろいろ難しいんだなと、しみじみ思う今日このごろです。 先日、社内勉強会で Ethernet や CPU などの話をしました。前回のCPUに関する話に続き、今回のスライドも幅広い方に読んでいただけそうな内容かと思いましたので、公開させていただくことにしました。前回のスライドを読んでない方は、できればそちらを読んでいただいてからの方が、より理解が深まるのではないかと思います。 忙しい人のために三行でまとめると 2020年代には、サーバのネットワークインターフェースが 40Gbps 超えてそうな予感 もし Ethernet でそれだけ大量のパケットをさばくなら、(標準化されてないけれど) Jumbo Frame 使わないと厳しいかも 2020年代には、NICやブロックデバイス等、CPUを取
こんにちわ。せじまです。スティック型PCの購入は、 Core M版が出るまで見送ろうと思っている今日このごろです。 弊社では「Mini Tech Talk」という社内勉強会を隔週で開催しているのですが、それとは別に、「Infra Tech Talk」という社内勉強会を、半年くらい前から毎月開催しています。わたしはそこでほぼ毎月、45-60分くらいのスライドを作って話をしています。今までどういう話をしてきたかといいますと、TCPに関する話を二回、SSDに関する話を二回しました。(InnoDBに関する話だと軽く5-6時間くらいできるんですが、いささかマニアックなので、もっと幅広い人を対象に話をしています) 今までの話はちょっと社内向けの内容だったんですが、前回開催された Infra Tech Talk では、社外の方にも幅広く読んでいただける話ができたと思いましたので、その資料を slides
2015-03-22 CPU実験でコアつくってOS動かしたまとめ 東大IS名物のCPU実験が3/17に最終発表を迎えて無事終了しました。半年のCPU実験を始めるにあたって初めにお世話になったのが先輩たちのブログだったりするので、恩返しの意味で僕もここに記録を残して置きたいと思います。基本的に今後ISでCPU実験を行う人々に向けた記事なので関係ない人が読んでも面白くないかもしれません…(OBが酒の摘みにニヤニヤしながら眺めるのはアリかも)。 CPU実験復習 CPU実験といえば 情報科学科の専門課程に入って1年しか経ってないぺーぺーの学部3年生に 半年間でCPUとコンパイラをゼロから自作させて 最終発表会でその性能を競う という知る人ぞ知る超鬼畜演習です。CPU・コンパイラの「性能」はmin-rtという共通のレイトレーサープログラムを動かすことで計測します。FPUは自作することが要求されます。
僕の学科では伝統的に3年の後期に半年かけてCPU実験というものをおこなう。 班で自作のアーキテクチャを設計・実装し、FPGA基板上でMinCaml(OCamlのサブセット)でかかれた課題用レイトレーシングプログラムが動けば単位がもらえるというものである。 レイトレ完動後には、その高速化にはげむもよし、余興としてゲームをつくるもよしで、自作CPU上で色々あそんだりする。 今年は有志で班を結成し、自作CPU上でxv6というOSを動かした。 僕はその班にCコンパイラ係として参加したので、そのことについてかく。 あと、OS移植班全体の成果についても触れる。 わりと長くなってしまったので、結局なにができたんだっていう人は、とりあえず先にこっちに飛んでほしい。 動機 期間は4ヶ月程度、配布されたFPGA基板のうえで動かしたいという制約のもとで移植するOSはxv6を選択した。 このOSはシンプルであるが
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く