2009年08月31日 AndroidのDalvikVMのインタープリタをFPU命令で少し高速化する(その1) AndroidのDalvik VMではJavaのバイトコードから変換されたDXコードというものをインタープリタで実行しています。DXコードの中には浮動小数点演算を行うための命令もあるのですが、現状のDalvik VMではFPU命令を使わずにすべてソフトウェアによる浮動小数点演算のライブラリを呼び出しています。 Android SDKのシミュレータでは実はkernelとqemuはVFPが有効になっているのでFPU命令を使うことができます。そこでインタープリタのコードの浮動小数点の四則演算の部分をFPU命令を使うように書き換えて少し高速化してみました。 2009年11月のEclairのソースリリースでだいぶ状況が変わっています。こちらも参照してください。 DalvikVMのインタープ
ARM も x86 と同じように、これまで様々な命令セットの拡張が行われてきました。 例えば乗算一つとっても多数の命令が存在しており、どれを使えばよいかわからなくなる ことがあります。 x86 に FPU と SSE 命令が共存しているように、ARM にも VFP や NEON 命令があります。 どちらの命令を使っても、単精度の浮動小数演算が可能です。 Cortex-A8 (ARM v7) の場合: 浮動小数演算 VFP 低速 倍精度演算対応 IEEE754 準拠 NEON 高速 単精度のみ SIMD NEON 命令は VFP 命令も混在しており区別が付きにくいことから、それぞれ演算速度を 調べてみました。 下記の表は気になる命令のみピックアップして調べたものです。 4 G 個 (40億個) の命令を実行した場合の時間の実測値です。 01: vld1.32 {d[0]},[r] 20.16
今日は、ARM CPUで出来るだけ計算を沢山行い、 ARM CPU自身の機能をしゃぶりつくすことについて書いてみる。 きっかけ twitterのつぶやきに、YUV422からRGB565への変換が遅いというのが、この記事を書くきっかけになった。 元のコードは高級言語で書かれているようである。 チューニング案 コンパイラの最適化を借りる この方法が順当である。ポータビリティも上がり非常に良い。 カリカリのアセンブラチューニング ふつうはしない。 今回は後者を行ってみる 対象ターゲットはARM その前に ARM CPU についての詳細は wikipedia 等を参照してもらうとして主な特徴は 32bit RISC CPU 16本の32bit汎用レジスタ 組込み向け/省電力向け用 となり、最近では携帯電話やポータブルゲーム機等にも採用されている。 ALU周り 今回、計算処理について語りたい。計算処
ぼちぼち iPhone 開発ネタも書いていこうかと。浮動小数点演算をバリバリ行うようなコードではコンパイラのオプションで Compile for Thumb (-mthumb) を無効にすると速くなるらしいので、実際どんなもんだろうと思ってベンチマークを取ってみました。ソースはこんな感じで、float と int のかけ算の処理をループさせたときの実行時間を測定しています。 #define CYCLES 100000000 void fp_test() { float a = 0.0000001f; float b = 1.0000001f; CFAbsoluteTime t1 = CFAbsoluteTimeGetCurrent(); for (int i = CYCLES; i >= 0; i--) { a = a * b; } CFAbsoluteTime t2 = CFAbsolu
ARMが日本で行った「ARM Technical Symposia 2011」では、“ARMのGPU”こと「Mali-T658」などARMの最新技術が紹介された。省電力に優れるARMで高性能を実現する秘策とは! “2020年に6倍”と急拡大するARMプラットフォーム ARMの組み込みプロセッサは、ここ数年におけるスマートフォンやタブレットデバイス市場の拡大に伴って採用デバイスが急増している。同社によれば、現在の携帯電話市場における台数シェアで9割がARMベースのSoC(System on Chip)だという。実際、iPhoneやAndroid搭載デバイスなど、多くのユーザーが持つ端末のほとんどがARMベースのプロセッサを搭載している。また、Microsoftが2012年のリリースを予定しているWindows 8でARM対応を表明しており、このことでARMがさらなる拡大を遂げる可能性は高い。
「big.LITTLE」+Mali,ARMが目指す2012年のコンピュートサブシステムとは ライター:米田 聡 ARM Processor Division VP Embedded Processors Keith Clarke氏 2011年11月11日に開催されたARMの開発者・パートナー向けイベント「ARM Technical Symposia 2011 Japan」のセッションから,「2012年のコンピュートサブシステム」と題されたセッションを紹介してみたい。 4Gamerでもいくつかの記事で報じてきたが,ARMはプロセッサコアIPCortexとともに,GPUコアIPとしてMaliを強く推している。セッションのタイトルにある2012年のコンピュートサブシステムにおいてもMaliが重要な位置を占めるが,なぜARMがそのような方向性を持つに至ったかが分かる内容も含まれていたので,そのあた
次世代64ビット対応ISA「ARMv8」や最新コア「Cortex-A7」に注目 ―― ARM TechCon 2011 福田 昭 CPUコア・ベンダである英国ARM社は,2011年10月25日~27日に米国カリフォルニア州Santa Claraで電子機器やLSIの開発技術者向けのイベント「ARM TechCon 2011」を開催した(写真1).本イベントでは,64ビット実行モードを用意した新しい命令セット・アーキテクチャ「ARMv8」や,最新コアである「Cortex-A7」などの情報が公表され,来場者の注目を集めていた. 写真1 ARM TechCon 2011の会場となったSanta Clara Convention Center ●64ビット・コンピューティングを初めて導入へ このイベントでARM社は,次世代CPUの命令セット・アーキテクチャ(ISA:Instruction Set A
英ARMは10月19日(現地時間)、同社アプリケーションプロセッサの新版「ARM Cortex-A7 MPCore」を発表した。現在スマートフォンで主流のCortex-A8/A9、そして前日に20nmでのテープアウトが発表された最新のCortex-A15と、ユーザーのニーズに合わせて高パフォーマンス路線を進むARMのアプリケーションプロセッサだが、一方で性能をそのままに、電力効率と実装面積の縮小による低コスト化を目指したのがCortex-A7となる。ARMによれば、現状で500ドルクラスのスマートフォンの性能を持つ製品が、Cortex-A7により2013-2014年には100ドル以下の価格で入手可能になるだろうと予測している。 ARMによれば、Cortex-A7は最も高い電力効率を実現したアプリケーションプロセッサで、同社のCortex-A5と同種のポジションを狙った製品といえる。ARMv
来日した英ARM Ltd.のLance Howarth氏(VP and General Manager, Media Processing Division)が,同社のGPUコア「Mali」の近未来について国内報道機関向けに語った。同氏の講演タイトルは「2016年のユーザー体験を実現するために」だった。
MIX11速報ではIE10のプレビューデモを動画を中心に掲載したが、ここでは4月12日(現地時間)に行われたMIX11基調講演で示された詳細情報を紹介しよう。 HTML5準拠でIE10のパワーを体験する 「標準に準拠していない」「とにかく動作が遅い」といわれ続けてきたInternet Explorerシリーズも、Internet Explorer 9(IE9)では、競合するWebブラウザが実装を進めているHTML5+CSS3への対応や、レンダリング/JavaScriptエンジンの改良による高速化などを目標に開発を進めてきた。 ただ、最初からすべてを実現していたわけではない。2010年3月に行われたMIX10で公開されたIE9 Platform Preview 1(IE9 PP1)ではcanvasタグはサポートせず、videoタグによる動画再生なども実装していなかった。しかし、それから半年あ
スターバックスの紙コップ利用を減らすためのアイデアコンペに優勝したのはコップのデザインではなく、“行動”をデザインするものだった!! 2011.02.01 石村 研二 石村 研二 スターバックスもパートナーとなったコーヒーカップの廃棄量を減らすためのアイデアコンペ「Betacup」が行われたことについてはgreenzでもお伝えしました。このコンテストの結果が発表されたのですが、その結果選ばれた「Karma Cup」はなんとコーヒーカップではなかったのです!しかも他のアイデアとは一線を画すエモーショナルな仕掛けがなされていました… このKarma Cupのコンセプトを示すイメージ画に書かれた言葉がまず印象的です。 A shared problem. A shared reward.(問題を分かち合い、報酬も分かち合おう) このKarma Cupのコンセプトを要約すると、店頭に黒板を置き、マイ
iPad搭載プロセッサ「A4」 AppleがiPadを発表して以降、そこに搭載された謎のプロセッサ「A4」に関係者の注目が集まっている。例えばVentureBeatでは、ジャーナリストやアナリストではなく、現場のエンジニアや元Apple関係者のコメントを集めて、その実体解明に乗り出している。 VentureBeatのA4に関する話題は「Apple’s A4 chip: Engineers correct stupid journalist」と「How Apple’s A4 chip lets iPad run cooler, save battery life」という2つの記事に見ることができる。どちらも、予測だけのジャーナリストの話ではなく、現場のエンジニアから意見を請おうという企画だ。だが怪しい情報ソースや思いつきに近い話もあり、必ずしも信頼に足る情報かという部分には目をつむってほしい
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く