ウェブアプリケーショのパフォーマンスチューニング - Devel::KYTProf 使って!Read less
プロセスに attach してトレースするデバッグコマンド strace の基本的な使い方です。 1. 実行コマンドをトレースする $ strace ls execve("/bin/ls", ["ls"], [/* 46 vars */]) = 0 brk(0) = 0x1ab9000 access("/etc/ld.so.nohwcap", F_OK) = -1 ENOENT (No such file or directory) mmap(NULL, 8192, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fcf695fb000 access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory) open("/etc/ld.so
2013.01.31 ITニュース いまやプログラマーの「必須プラットフォーム」となりつつあるGitHub。サービス開始からわずか5年で全世界にユーザーを獲得してきた同社は、独自の経営理念によって「プログラマー天国」を築き上げていると評判だ。その根底にある考え方や、組織運営のこだわりとは何なのか? 来日中のGitHub経営陣に、編集長の伊藤健吾が話を聞いた。 GitHub COOのPJ Hyett氏(左)と、CIOのScott Chacon氏(右)。多忙なスケジュールの中で取材に応じてくれた 「これからの時代、プログラマーをやりたい人にとって、GitHubアカウントを持たなくて済むのは小学生までとなるでしょう」 弊誌対談「小飼弾×増井雄一郎が大激論! 開発者「大増殖時代」の到来で、プログラマーの存在意義はどう変わる?」で小飼氏がこう述べるほど、世界中のプログラマーに利用されるようになった開
"fireking" by cmyk1219 1. 概要 reduceとscanはGPGPUなどの並列環境下において重要な役割を果たす関数だけど、あまりこれらの関数、特にscanについて言及している記事はあまり見かけない。なので今回はreduceとscanについて調べた結果をまとめていきたいと思う。 2. reduce, scan関数の概要 2.1. reduce scanについてはreduceが分かればより理解しやすくなるので、ひとまずはreduceから始めることにする。 reduceとは、端的に言うと、対象のリストを与えられた二項演算子で纏め上げる関数だ。とは言っても、いきなりそんなことを言われてもよく分からない。まずは例を見ていこう: >>> import operator >>> reduce(operator.add, [1, 2, 3, 4, 5]) 15 >>> reduce
"The Great Day of His Wrath" by John Martin はじめに 世はまさに大並列時代。火を手にした人類が飛躍的な進化を遂げたように、並列化のパラダイムは、今まで到底不可能と思われていた速さで計算を行うことができるようになりました。 ところが、どんな手法にも欠点は存在するもので、実際に実装しようとすると非常に難しい。何故かというと、並列には並列化特有の問題が存在しており、愚直に実装してしまうとCPUより早くなってしまうどころか遅くなってしまうことだってあり得るのです。これを回避するにはGPUの内部構造についてきちんと理解をした上で、実装したいアルゴリズムそれぞれの場合に特化したコーディングを行う必要がある。 しかしよくよく考えるとおかしな話です。私たちが実装したいのはあくまで手法であり、ハードウェアではありません。なぜこのような詳細について把握する必要がある
UNIVERSAL::require$module->require() or die $@ ってかけるのが cool という話ではあるのだが、UNIVERSAL をつかうのに抵抗があるかもしれない。 そして、Module::Load にたいする優位性はとくにないので、最近はあまりつかってない。 Class::Load上記2つにくらべると、機能がおおい。これは Moose から派生したパッケージで、Moose の is_class_loaded 相当の機能もそなえている。 Moose 由来ということで、%INC の中にはいっていなくても、package がすでにつかわれていれば、ファイルをよみにいかないという点がすぐれている。具体的には package Foo; sub bar { } package main; use Class::Load qw/load_class/; load_c
We are pleased to announce that HPN-SSH 17v11 has been released and is now available on https://github.com/rapier1/openssh-portable. This version brings HPN-SSH up to parity with OpenSSH 9.2 and resolves a number of minor bugs. Patches and binary packages will be released the week of February 20, 2023. Pittsburgh Supercomputing Center 300 S. Craig St. Pittsburgh, PA 15213 Phone: 412.268.4960
NAME File::Next - File-finding iterator VERSION Version 1.18 SYNOPSIS File::Next is a lightweight, taint-safe file-finding module. It has no non-core prerequisites. use File::Next; my $files = File::Next::files( '/tmp' ); while ( defined ( my $file = $files->() ) ) { # do something... } OPERATIONAL THEORY The two major functions, files() and dirs(), return an iterator that will walk through a dire
FLOPS(フロップス、Floating-point Operations Per Second)はコンピュータの性能指標の一つ。 FLoating point number Operations Per Secondの名称が示す通り、1秒間に浮動小数点演算が何回できるかの指標値ひいては性能値の事を指す。 ハードウェアの仕様として用いられるのは理論値であるが、ベンチマークソフトなどの計測から導き出される計測値は、理論値からは原則的に下がる。その為、理論値だけでなく、「理論的に算出された値の何%で実際のプログラムが動作するか」ということが重要になる(実測値)。実際の値が理論値に近いほど、より効率的なコンピュータだと考えられるからである。 パーソナルコンピュータ(以下PCと表記)向けのCPUやGPUメーカーは、計算ノードとしては単一のノードとなるので通常理論値で発表する(理論値がほぼそのまま実
Keplerアーキテクチャを採用したTesla K20や、x86命令セットを採用した新アーキテクチャのアクセラレータXeon Phiなど、HPC向けに様々なアーキテクチャが発表されたこの1年。これらの最新プロセッサの状況を踏まえながら、FLOPS値の計算方法についておさらいしておこう。 FLOPS値とは FLoating-point Operations Per Second(一秒間あたりの浮動小数点演算)の略で、その名の通りプロセッサが一秒間に何回の浮動小数点演算を行えるかの回数を示す性能指標である。FLoating-point OPerationSの略とし、浮動小数点演算の計算量を表す単位としての用法も見受けられるが、このページでは前者の意味でこの言葉を使っていく。 「浮動小数点演算」の定義は実は微妙な問題であるが、プロセッサメーカーの宣伝用語としては カウントに使われるのは加算と乗
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く