タグ

ブックマーク / pc.watch.impress.co.jp (18)

  • 後藤弘茂のWeekly海外ニュース

    ●人材を引き入れて変身を繰り返すNVIDIA NVIDIAの技術的な方向性は、同社にどんな人物が加わったかによってわかる。NVIDIA GPUの最大の転機となった「GeForce 8800(G80)」の背後には、並列コンピュータのアーキテクトであるJohn Nickolls(ジョン・ニコルズ)氏(現Director of Architecture, Nvidia)がいた。Nickolls氏は、超並列SIMD(Single Instruction, Multiple Data)スーパーコンピュータ「MasPar Computer」のアーキテクトだった人物。MasParのアーキテクチャを、部分的にGPUに持ち込んだ。「(MasParとG80には)違う部分も色々あるが、元になっているアイデアは非常に似ている」とNickolls自身も語っていた。 NVIDIAの人材集めはGPUハード絡みだけではな

    TKashiwagi
    TKashiwagi 2009/04/04
    (1)多くの小型プロセッサを集積することで並列性を高める、(2)SIMD型処理と明示的なコードマネージメントによってコントロールオーバヘッドを減らす、(3)分散型で階層型のレジスタによってデータ移動を減らす。つまり、
  • https://pc.watch.impress.co.jp/docs/2009/0224/kaigai_01.jpg

  • 後藤弘茂のWeekly海外ニュース

    ●最初の世代のLarrabeeをゲーム機に載せるのは困難 ソニー・コンピュータエンタテインメント(SCE)は、次世代のゲームコンソール(据え置きゲーム機)PLAYSTATION 4(PS4)のCPU&GPU選定を進めている。選定の中で、SCEはPS3に使っているCell Broadband Engine(Cell B.E.)を拡張する方向だけでなく、他のCPUを使うことも検討している。そして、その中には、Intelのスループットプロセッサ「Larrabee(ララビ)」をCPU&GPUとして使う案もあった。 Larrabeeは、最初の世代で最大16コアと推定される多数のCPUコアを集積したメニイコアCPUだ。16wideとSSEの4倍のベクタ演算ユニットを備え、GPUと同じように3Dグラフィックス処理を行なうことができる。CPUコア自体はx86互換であり、通常のCPUとして扱うことが可能だ。

    TKashiwagi
    TKashiwagi 2009/04/04
    しかし、IntelやAMDといったCPUベンダーは、2003~2004年にかけて方向を転換。レガシーをある程度犠牲にしても、純粋なCPU性能を向上させる方向へ向かうことにした。これまでとは違ったアーキテクチャや命令をどんどん追加
  • 【後藤弘茂のWeekly海外ニュース】CPUのアーキテクチャ時代の転換点となるAMDの「Bulldozer」

    ●2011年にCPUアーキテクチャを変革するIntelとAMD PC&サーバー向けのx86 CPUにとって、おそらく2011年が次の大きな転換点となる。単なるアーキテクチャの変わり目ではなく、10年に1度のターニングポイントだ。 IntelとAMDの2011年までのCPUロードマップが見えてきたことで、x86 CPUワールド全体の大きな流れが見えてきた。簡単に言えば、2004年から2010年の「マルチコア化時代」が終わりを迎え、2011年からは「マルチコア+ベクタ拡張+システム統合時代」に入る。2011年がCPUアーキテクチャの方向が再び変わるターニングポイントとなる。今年(2009年)から来年(2010年)は、そのための助走時期で、慣性でマルチコア化が続く時期となりそうだ。 昨年末から今年にかけて、IntelとAMDの双方が、CPUコアアーキテクチャの転換を2011年に据えたことを明らか

    TKashiwagi
    TKashiwagi 2009/04/04
    そしてムーア氏は、2010年からは「システムレベル統合時代(System-level Integration Era)」に入ると説明している。ヘテロジニアス(Heterogeneous:異種混合)型にプロセッサとアクセラレータ群を統合、システムレベルの機能をより統合
  • 後藤弘茂のWeekly海外ニュース

    ■後藤弘茂のWeekly海外ニュース■ KhronosがGDCでGPUやCell B.E.をサポートするOpenCLのデモを公開 ●OpenCLの実装テストのスタートは5月 世界中のゲーム開発者が集まるカンファレンス「GDC (Game Developers Conference)」でKhronos Groupは、ヘテロジニアスな並列コンピューティングのためのプログラミング言語である「OpenCL」のオーバービューのセッションを行なった。 OpenCLは、NVIDIAの「C for CUDA (OpenCLもCUDAのランタイムに落とし込むため、従来の拡張CをベースにしたCUDAはC for CUDAと呼ぶようになった)」のように、GPUを汎用コンピューティングに使うことができるプログラミング言語だ。しかし、NVIDIA独自のC for CUDAとは異なり、クロスプラットフォームのプログラ

    TKashiwagi
    TKashiwagi 2009/04/04
    コントリビュータのリストのIntelの名前も興味深い。Larrabeeのグラフィックス側のアーキテクトであるLarry Seiler氏や、IntelがLarrabeeのために買収したと言われるNeoptica(GPU向けの汎用プログラミングモデルを開発していた)出身の
  • 【後藤弘茂のWeekly海外ニュース】IntelがGDCでLarrabeeの命令セットの概要を公開

    ●Larrabee新命令の情報だけを公開 Intelはゲーム開発者向けカンファレンス「GDC(Game Developers Conference)」の技術セッションの中で、新アーキテクチャの高スループットメニイコアCPU「Larrabee(ララビ)」の命令セットの概要を明らかにした。Larrabeeは16~24個(2世代目)のCPUコアを搭載すると言われるx86系メニイコアCPUだ。CPUコアはPentium(P54C)相当のIn-Order実行2命令発行のパイプラインで、それぞれのCPUコアに16-wideのベクタユニットを搭載する。CPUとしてプログラムできるが、GPUと同レベルのグラフィックス処理もできる、つまり、CPUGPUを兼ねることができる点がLarrabeeの大きな特徴だ。 GDCでは、x86命令セットに拡張として加えられた100以上のLarrabee新命令(LRBniま

    TKashiwagi
    TKashiwagi 2009/04/04
     LRBni(LNI)では、プレディケーションが可能であるため、SSEとは異なるデータ配列を取りやすい。SSEでは、データを「AOS(array of structure)」と呼ぶ配列にするのが一般的だ。それに対して、LRBniでは、多くの場合データを「SOA(str
  • 後藤弘茂のWeekly海外ニュース

    TKashiwagi
    TKashiwagi 2009/01/31
    示唆の通りだとすれば、将来のPC向けのCPUのあり方が、根本から変わる可能性もある。具体的には、将来のPC向けCPUの主流は、現在のAtom (Silverthorne:シルバーソーン)のような、ILPを抑えた小さなCPUコアに、高いDLPで浮動小数点
  • 【後藤弘茂のWeekly海外ニュース】そしてCPUはDRAMダイも統合する

    ●高パフォーマンスCPU時代、最大のネックがメモリ CPUGPUが一緒になるだけでなく、CPUとメモリも一緒になろうとしている。数年後の高スループットCPUは、DRAMダイ(半導体体)をCPUと同じパッケージに封入する可能性が高い。マルチコア化とベクタ演算能力を強化(またはGPUコア統合)したCPUに、DRAMもくっつく。言ってみれば、「CPU+GPU+DRAM」という姿へと変わることになる。 理由は簡単だ。TFLOPSパフォーマンスを狙うCPUが、数百GB/secのメモリ帯域を必要とするためだ。フル性能を発揮するために必要なピーク数百GB/sec帯域を実現するためには、現在の数十GB/secから一気に10倍へメモリ帯域を高めなければならない。しかし、3~4年にデータ転送レートを倍々に引き上げるDRAMロードマップでは、この帯域を到底実現できない。メモリインターフェイス幅を広げることも

    TKashiwagi
    TKashiwagi 2009/01/05
    ●高パフォーマンスCPU時代、最大のネックがメモリ  CPUとGPUが一緒になるだけでなく、CPUとメモリも一緒になろうとしている。数年後の高スループットCPUは、DRAMダイ(半導体本体)をCPUと同じパッケージに封入する可能性が
  • 今年の話題はネットブックとSSD - 元麻布春男の週刊PCホットライン

    12月25日、社団法人電子情報技術産業協会(JEITA)は、2008年度11月分のPC国内出荷実績を発表した。 それによると2008年11月の国内PC出荷台数は64万2千台で、前年同月比93.3%。景況が悪化していることを考えると、製品ジャンルとしてはなかなか健闘している数字ではないかと思う。 ただし詳細を見ていくと違う姿も見えてくる。ハッキリしていることの1つはデスクトップPCの退潮に歯止めがかからないこと。11月の出荷台数は前年同月比75.7%で、24.3%のマイナス。オールインワンの液晶一体型、セパレート型のいずれも悪い。 これに対しノートPCは、前年同月比で103%とプラスを記録。全体に占める割合も71.1%と、7割を超えた。ちょうど海外からもPCの世界市場に占めるノートPCの割合がついにデスクトップPCを上回ったというニュースが飛び込んできた。すでに先進国ではノートPCデスク

    TKashiwagi
    TKashiwagi 2009/01/05
    今、同じことを期待するとしたら、それはSSDしかない。将来、「いやー、32GBのSSDに10万円も出しちゃったよ」とか、「SSD内蔵のノートPCによく40万円も出したなぁ」とか語るためにも、暴落覚悟でSSDを買う必要がある。マニ
  • 【後藤弘茂のWeekly海外ニュース】未来に強く過去に弱いIntelのLarrabee

    ●転換したCPUが抱えた3つのチャレンジ 2004年の早い時期にIntelは、巨大コアのCPU「Tejas(テハス)」をキャンセル、同じく巨大コアだったと推定される最初のプランの「Nehalem(ネハーレン)」の設計方針を修正した。ほぼ同じ時期にAMDはK8後継のCPU「K9」の開発を中止している。振り返れば、2004年がx86系CPUのアーキテクチャの転換点だった。 x86の2大メーカーの軌道修正は、2002年から2003年頃に明瞭になったCPUコアのシングルスレッド性能向上の停滞と、停滞の原因であるCPU消費電力の急上昇の結果だ。2002年の時点で、シングルスレッドのシーケンシャルコードの性能を上げることが難しいことが明瞭になった。そのために、CPUベンダーは、マルチコア化とベクタ演算の強化によって性能を上げる方向に転じた。 2003~2004年にかけてIntelとAMDの両者はそうし

    TKashiwagi
    TKashiwagi 2008/12/25
     これはグラフィックスの場合だが、じつは汎用アプリケーションでもちょっと似たようなケースが出る場合がある。HPC(High Performance Computing)のような分野では、CPUコアへの上りのデータ量は多いが、下りは極端に小さい場
  • SanDisk、SSD向けファイルシステム「ExtremeFFS」を解説~“プチフリ”と無縁な、高速化技術

    SanDisk、SSD向けファイルシステム「ExtremeFFS」を解説 ~“プチフリ”と無縁な、高速化技術 米SanDiskでSSDマーケティング部門の上級ディレクターを務めるDon Barnetson氏に、同社のSSD製品/技術に関する話を伺う機会を得た。同社はここ最近、SSDに関する指標や新技術を立て続けに発表している。一部、過去のレポートと重複する点もあるが、高速化技術などについて具体的なメカニズムは、今回初めてお伝えする。 ●SSDのランダムライトを100倍高速化するExtremeFFS 同社は'94年に、NANDフラッシュメモリ用ファイルシステム「TrueFFS」を開発した。これは、Windows 95や、一般的な携帯電話などに採用されている。NANDフラッシュメモリでは、データを直接上書き/変更することができず、書き込む前に一度消去という作業を行なう必要があるが、TrueFF

    TKashiwagi
    TKashiwagi 2008/11/30
    ExtremeFFSは、このブロック単位の消去を不要とする。具体的には、書き換えを行なうページに対し無効というマーキングだけを残し、実際に消去は行なわず、空いている別の場所にページ単位で書き込みを行なう。  この作
  • 【後藤弘茂のWeekly海外ニュース】GPUとの違いが際立つLarrabeeキャッシュアーキテクチャ

    ●増えるプロセッシング能力に追いつかないメモリ IntelのLarrabeeは、各CPUコアが256KBのL2キャッシュを持ち、そのメモリの中でタイルに分割したレンダリング処理を行なうコンセプトを取っている。IntelがLarrabeeの最大の特徴であるソフトウェアレンダラで、タイリングアーキテクチャを取った理由は、データの局所性(Locality)を最大限に利用するためだ。その背景には、コンピューティング要素を増大させることは簡単だが、データ帯域を増大させることは難しいという現在の半導体チップの問題がある。また、この構造は、内部バス構造を多様なアプリケーションに対応しやすい柔軟なリングバスにすることとも密接に絡んでいる。 簡単に言えば、Intelは、Larrabeeを、ハイエンドGPUのように超広帯域メモリと特殊なデータパスに頼った構造にはしたくなかった。超広帯域メモリはGPUを巨大なダ

    TKashiwagi
    TKashiwagi 2008/11/26
     「マルチコアCPUでコア数が2や4なら、ブロードキャスティングやスヌーピングなどのテクニックでコヒーレントキャッシュはできる。しかし、より多くの(コア)数になると、スヌーピングのトラフィックはデータトラフィ
  • NVIDIA、Teslaを使った「パーソナルスパコン」の仕様を策定

    NVIDIA、Teslaを使った「パーソナルスパコン」の仕様を策定 ~NECやサードウェーブ、ユニットコムなどが製品化 11月18日(現地時間)発表 米NVIDIAは18日(現地時間)、同社製GPUコンピューティングカード「Tesla」を使ったデスクトップPCの仕様を策定し、それに基づいた製品がOEM各社から発売されると発表した。 ドスパラのTesla搭載機「FRACTICA」。BTOに対応し、Intel/AMDの両プラットフォームが用意されるが、このデモ機はCore i7、メモリ6GB、Tesla×3、Quadroを搭載する。電源はこの製品専用に開発したもの TeslaはGeForce GPUをベースにしたGPUコンピューティング用の製品。ハードウェアはビデオカードとほぼ同じだが、ビデオ出力がなく、GPUコンピューティングのアクセラレータとして利用するもの。 Teslaには、PCI Ex

  • AMDが新マイクロアーキテクチャCPU 「Orochi」と「Ontario」を2011年に計画 - 後藤弘茂のWeekly海外ニュース

    ■後藤弘茂のWeekly海外ニュース■ AMDが新マイクロアーキテクチャCPU 「Orochi」と「Ontario」を2011年に計画 ●CPUロードマップとFab計画の全貌を明らかに AMDは11月13日(日11月14日深夜)に行なったアナリスト向けカンファレンス「2008 Financial Analyst Day」で、2011年までのプロダクトロードマップを発表した。昨年(2007年)のAnalyst Dayで、ロードマップからいったん姿を消した次世代CPUコア群「Bulldozer(ブルドーザ)」と「Bobcat(ボブキャット)」が2011に再登場した。BulldozerベースのデスクトップCPUは「Orochi(オロチ)」、Bobcatベースのウルトラポータブル/ミニノート向けCPUは「Ontario(オンタリオ)」となる。 これらのCPUのプロセス技術は32nmとなる。また、

    TKashiwagi
    TKashiwagi 2008/11/14
    Sao-Pauloと同じタイミングで12コアの「Magny-Cours(マニクール)」も投入される。こちらは、デュアルダイ(半導体本体)になると言われている。
  • 後藤弘茂のWeekly海外ニュース

    ●Larrabee CPUコアとPentiumコアを比較 Intelは、新命令『Larrabee NI(New Instructions)』の最初の実装であるCPUアーキテクチャ「Larrabee(ララビ)」では、シンプルなIA-32(x86)系CPUコアをベースに開発した。すでに知られているように、IntelはLarrabee CPUコアを、Pentium(P5)をスタート地点として開発したとしている。Intelが、SIGGRAPH、Intel Developer Forum(IDF)、Hotchipsなどで公開したLarrabeeのアーキテクチャチャートを見ると、Pentiumをベースにしたことがよくわかる。 下の図は、LarrabeeのCPUコアをPentiumと比較したチャートだ。図の中で、ブルーの部分はPentiumに由来するユニット群、グリーンの部分はLarrabeeで新たに加

    TKashiwagi
    TKashiwagi 2008/11/14
    プログラムの中にベクタ条件分岐があると、ベクタユニットの各レーンで、それぞれ条件判定によって異なる分岐パスを実行できる。「if-then-else」型のコントロールをレーン単位で実行できる。レーン0は条件が成立して命
  • 【後藤弘茂のWeekly海外ニュース】メモリ帯域をセーブするLarrabeeアーキテクチャ

    ●演算はコストが安いが帯域はコストが高い CPUコア数はムーアの法則に従って増えつつあり、45nmプロセスのサーバーでは、CPUコアの大きなIntel CPUでもネイティブ8コアに到達する。PC&サーバー向けの大型CPUコアでも10コア越えは目前で、CPUコアがより小型な「Larrabee(ララビ)」では16コアに達すると言われている。Larrabeeタイプのプロセッサが世代毎にCPUコア数を増やすと、24コア32コアはすぐにやってくる。 こうしたメニイコア時代のCPUの最大の問題の1つは、外部メモリバスと、オンチップインターコネクト、そしてメモリ階層の構成。この3つは密接に絡み合ってプロセッサの設計に大きな影響を与える。そして、今までのCPUでの手法は、メニイコアでは通じない。コアが数個の時と同じインターコネクトとメモリの構成では、数十個のコアを効率よく接続して動作させることができないか

    TKashiwagi
    TKashiwagi 2008/11/14
    やっぱりだ Cacheが鍵か
  • 【後藤弘茂のWeekly海外ニュース】2010年以降のIntel CPUが見えてくるLarrabee新命令

    ●Intelの命令アーキテクチャ拡張の流れにあるLarrabee新命令 Intelにとって「Larrabee(ララビー)」とは何か。Larrabeeが、スループットコンピューティングに特化して、ベクタ演算とマルチスレッドパフォーマンスにフォーカスした特殊なプロセッサ製品であるのは明らかだ。しかし、Larrabeeの新命令『Larrabee New Instructions (LNI) 』自体は、もっと汎用的なものだ。おそらく、IntelのメインストリームCPUの、長期の命令セットロードマップ上に位置する。そのままでないとしても、おそらくLarrabeeとよく似た命令セット拡張が、PC&サーバー向けCPUにも実装される日が来るだろう。 Intelは長期ビジョンとして、PC&サーバー向けのCPUでもベクタ演算の機能を高めて行くことを明らかにしている。今年(2008年)春のIDFでは、今後のCP

    TKashiwagi
    TKashiwagi 2008/10/19
    ベクタ演算の強化によって「データレベルの並列性(DLP:Data-Level Parallelism)」を上げるが、依然としてスカラ演算の「命令レベルの並列性(ILP:Instruction-Level Parallelism)」も維持し、マルチコア化とハードウェアマルチスレッディン
  • Intel、SLC採用のエンタープライズ向け高速SSD

    Intel、SLC採用のエンタープライズ向け高速SSD ~リード250MB/sec、ライト170MB/sec 10月15日(現地時間) 発表 米Intelは15日(現地時間)、エンタープライズ向けの高速SSD「Intel X-25E Extreme SATA SSD」の容量32GBモデルを出荷開始した。1,000個ロット時の単価は73,600円。容量64GBのモデルは2009年第1四半期の出荷を予定している。 Intel X-25E Extreme SATA SSDは、SLC(Single Level Cell)を採用したサーバー、ワークステーション、ストレージシステム向けの2.5インチSATA SSD。NANDフラッシュメモリの製造プロセスは50nm。 10チャンネルのパラレルアクセスとNCQを組み合わせた独自コントローラを搭載し、リード250MB/sec、ライト170MB/secと高速

    TKashiwagi
    TKashiwagi 2008/10/19
    いいねえ、なんとかして手に入れる!
  • 1