概要 Linuxのパフォーマンス解析ツールであるperfの使いかたの紹介 背景 個人的にperfよくできてると思うので紹介したいというのと、 パフォーマンスカウンタの読み方ってあんまり知られてないみたいなので、 それの解説を書きたい。 構成 perf について説明したあと、パフォーマンスカウンタの読みかた、見かた、を説明する。 perfとは何か Linuxに付いてくるプロファイラ。 man perf によると、 NAME ---- perf - Performance analysis tools for Linux と、書いてある。名前がひどいのでなんとかしてほしい。 perf の特徴 個人的には、手軽に使えるのが素晴らしいと思う。 2.6.31以降カーネルに標準で付いてる。(Ubuntuだとlinux-tools-common(TODO:あとで確認)で入るはず) 特殊な設定が必要無く、
NVidia/ATI GPUs used as DSP for convolution reverb calculation GPU Impulse Reverb VST is an effect plugin that calculates convolution reverbs by using your graphics card as DSP for realtime reverb calculation with a CPU usage of near 0%. Any consumer graphics card that supports OpenCL (NVIDIA / ATI or others) can be used without any need for other specific hardware. All common VST hosts are suppo
SPU-Based Deferred Shading in BATTLEFIELD 3 for Playstation 3 This document discusses using the SPUs on the PlayStation 3 to perform deferred shading for Battlefield 3, offloading work from the GPU. It provides an overview of the SPU-based deferred shading approach, including breaking the screen into tiles that are processed by multiple SPUs in parallel. Algorithmic optimizations discussed include
僕が抱える不治の病のひとつに、floorとceilのどっちがどっちだか永遠に覚えられないという病気がある。 特に問題なのが、あの記号である。あの記号は、僕の直感とは反対の意味を持つ。 僕の直感では、↓この記号は「天井が降りてきて値が減る」というイメージ ↓この記号は、「床が上がってきて値が増える」というイメージ なのであった。これは逆で、上の記号のほうがceilで切り上げ、下の記号のほうがfloorで切り捨てである。 と、いうわけで、仕方が無いので、僕はこれを「自分の直感とは逆なんだからねっ!!」というように覚えていたのだが、そういう覚えかたは肝心なときに、「あれ…逆ってどっちだったっけ…」とかなりがちである。 この覚えかたを、「可動式床天井方式」…それの反対なので…「反可動式床天井式(以後、反可式)」としておこう。 僕は長いこと反可式で覚えていたわけだが、あまりにどっちがどっちだかわから
思いついたので集めてみました. オープンソースと言うと幅が広いですが,自分が今まで見た事のあるVFX/CG系の会社やツールなどで実際に使用実績があり,プロジェクトの種類が(広い意味で)CG関係の物です.boostやQtなどのように一般に広く使われている物,CgやCUDA,FBXのようなフリーでもオープンソースではない物は除いてあります. * 画像・テクスチャ関係 OpenEXR OpenImageIO Ptex OpenFX OpenCV * シーングラフ OpenSceneGraph COLLADA * ジオメトリフォーマット Houdini GPD library GTO HDF5 Alembic * シミュレーションエンジン Bullet Physics Library ODE SOFA * 幾何学関係 Sony Vector Math Library Sony SIMD Math
(2016/02/10 追記: EASTL は長らく EAWebKit の一部としてライセンスが不明瞭なまま公開されていましたが、この日 BSD ライセンスで正式に公開されました https://github.com/electronicarts/EASTL) 若干古いものですが、2007 年に発表された、Electronic Arts によるゲーム開発向けの改良を加えた STL、"EASTL" の仕様。 http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2007/n2271.html 仕様だけで実装が公開されてないのが非常に残念なのですが、それは別として、何故こんなものが必要なのか、どういう事情でこの機能が盛り込まれたのか、といったゲーム開発現場の事情が細かく解説されていて、とても参考になります。特に、既にある程度 C++ に習熟してい
iphoneアプリの画面設計をしていて、画面フローの表記をしようとして普通の画面フローチャートだとUIインタラクションを表記しにくいよね、と思ったので考えてみた。 画面フロー図の限界webの画面フロー図は以下のことができないなー、不便だなーと思ってた。 画面展開を表記する記法がない。webだと_blankくらいしかないけどアプリだと不便 画面が内包しているコンポーネントを表記できないので、画面のどのボタンが次の画面につながっているのかわからない。 ↑レベルのを練ろうとするとワイヤーフレーム/プロトタイプをつくる作業になってしまう。プロトタイプだと逆に画面のつながりや展開の法則性がとらえにくく、整合のとれたインタラクションデザインが試行錯誤しにくい そもそも画面展開の種類って網羅的に把握されてる? 構造化寄りの表記方法は「情報アーキテクチャ、インタラクションデザイン記述のためのビ
平たく言えば、最適化はともかくとして、"高速なシーケンサとしてCPUを使いたい"がために作られる小さなコンパイラというジャンルのライブラリがある。 必要性 これらのライブラリは、パフォーマンスに関する魔法の薬では無い。ある特定の目的のためには良く働くが、通常のコンパイラよりも特殊な目的のために設計されている。 大抵、"コンパイルすべきプログラムがコンパイル時に決定できない"場合に用いられる。qemuやnanojitの場合は実行対象のプログラムであり、orcの場合はデコードのパラメタ等。 従来は、パラメタに応じてコードを全て書くとか、コードの自己書き換えのようなことが行われていた。 http://www.geocities.jp/daichi1969/synthprog/index.html#osc3 このコードは、Ring/Sync/FMの状態に応じて動作する「汎用の」ルーチンと言える。し
■ ご契約の流れについて 評価 ご依頼頂くことで30日間の「無償評価ライセンス」を発行させて頂きます。 30日間を超えて評価頂く場合、またはプロトタイプ開発に合わせて評価を行いたい場合などのご要望により 「有償評価ライセンス」もご用意しております。詳しくは担当営業までお問合せください。 ご導入 ご導入にあたって以下のライセンス契約を締結させて頂きます。 – ソフトウェアライセンス基本契約書 – ソフトウェアライセンス個別契約書(タイトル毎) – 機密保持契約書(NDA) – 反社会的勢力排除に関する覚書 ご延長 ライセンスは有料によりご延長可能です。 ご延長は基本的に自動継続となります。 終了されたい場合はご契約期間終了の1ヵ月前までにご連絡くださいませ。 ■ ライセンス許諾費用について 各ビジネスやご事情に応じて、違いがございますので担当営業までご相談ください。 ■ テクニカルサポートに
CPUの動作速度と比較して、メインメモリは遅い。 PCで使われているスカラ型CPUは内部にキャッシュを持ち、メインメモリとの動作速度の差を吸収しようとしている。 キャッシュにヒットすれば即座に読み出せるが、ヒットしなければメインメモリからの読み込み待ちとなり、膨大なウェイトが入る。 CPUのL1キャッシュは物によって違うがだいたい32byteか64byteあたりのキャッシュラインサイズで、メインメモリのどこか1つでも読まれると、32/64byteがキャッシュにロードされる。 普通は近いアドレスへのアクセスが多いだろうから、このようにすることで、連続したメモリに対するアクセスを高速化しているわけだ。 逆に言えば、完全にランダムなメモリアクセスをするプログラムはキャッシュ効率が非常に悪く、スカラ型CPUはキャッシュにヒットしなければゴミ同然で、このへんを考えることは実行速度にとっては重要だ。
フリーセル解決手順のプログラムによる探索実行結果 フリーセル百万種類のゲーム全てに対してサンプルプログラムを実行したところ、おそらく勝てないと言われている 11982、146692、186216、455889、495505、512118、517776、781948 以外のゲームでは勝つことができました。 百万種類のゲームの中で 57148、563096 の二つはコンピュータにとって勝つのが難しい性質を持っています。非常に長い堂々巡りの手順が現れ、およそ四百万局面ぐらいの同一局面判定ができなければ勝てません。また最初の一枚をホームセルへ置くまでの手数が長いので、先読みを長くしなければ勝ち手順を見つけることができないのです。この二つのゲームに勝つために、最大手数を 8,192 (freecell.h : MAX_SEARCH_DEPTH)、同一局面判定上限を 4,194,304 局面 (mov
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く