[B! チューニング] kenichiiceのブックマーク

kenichiice id:kenichiice

チューニングに関するkenichiiceのブックマーク (39)

GitHub - koute/not-perf: A sampling CPU profiler for Linux
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
kenichiice 2023/05/22
perf

linux

チューニング

profiler
リンク
行列積計算を高速化してみる｜やまもと
機種名　　　：MacBook Pro CPU　　　　：Dual-Core Intel Core i5 動作周波数　：2.9GHz プロセッサ数：１コア数　　　：２ SMT　　　　：有効 L1キャッシュ：32KB L2キャッシュ：コアあたり256KB L3キャッシュ：４MB明示されていませんが、購入時期から考えて、CPUのマイクロアーキテクチャはSkylake Microarchitecture（最新資料だと、Skylake Client Microarchitecture）だと思われます。動作周波数は、CPUIDの情報だと基本が2.9GHz、最大が3.3GHzに設定されていました。CPU使用量が増加すると、Tarbo Boost テクノロジーによって、自動的に動作周波数が上がる可能性があります。コア数は2個ありますが、まずは１コア性能を向上させたいと思います。SMT（ハイパー・スレッ
kenichiice 2021/05/26
アルゴリズム

数値計算

チューニング

数学
リンク
サーバーさんに本気を出してもらうために憶えておきたい設定項目
cpuspeed がオンだと.... — はせがワン (@hasegaw) 2014, 5月 29 ミドルウェアのスループットを測ろうと思ったのですが cpuspeed などの設定をぜんぜんやっていませんでした。。。経験上、チューニング過程でいじりたくなるようなパラメータを思い出してみます。パワーマネジメントに関する設定はオフにする UEFIやBIOSにはパワーマネジメント設定がありますが、これらを無効にするとプロセッサなどが無条件で定格クロックで走り続けます。ピーク性能を高めたり瞬発力を上げるためにはパワーマネジメントはオフにします。当然ながらベースの消費電力やファンの騒音は増えますが、かわりにいくらかピーク性能の向上が見込めます。 Hyper Threading はレイテンシーとスループットのトレードオフ Hyper Threadingは、たぶん、コア内でパイプラインを取り合うから
kenichiice 2020/07/19
チューニング

サーバ
リンク
Linux perfで快適に計測するためのtips - Qiita
これがあるのとないのとでは分かりやすさが全然違うので、perfを使う時は常に入れておくようにすると便利です。 2. --call-graph は fp 以外で使う上記の問題を解決すると perf record + perf report では何が呼ばれているかおおむね分かることが多いのですが、call graphを出すために perf record -g をすると [unknown] というのが出てきてしまうことがあります。(以降の計測結果はRack::Utils::HeaderHashを使ったRuby VMのベンチをRubyのmasterで走らせたものです) Samples: 38K of event 'cycles:ppp', Event count (approx.): 271180000 Children Self Command Shared Object Symbol - 1
kenichiice 2019/12/15
perf

チューニング
リンク
Ruby 2.6.0とより高速なcsv - 2018-12-25 - ククログ
Rubyの標準添付ライブラリーのcsvをメンテナンスしている須藤です。歴史 csvは名前の通りCSVを読み書きするための便利ライブラリーです。もともとRuby 本体とは別に開発されていたのですが、Ruby 1.8.0のときにRuby 本体にバンドルするようになりました。dRubyやREXMLがRuby 本体にバンドルされたのも同じタイミングです。Ruby 1.8.0のときにバンドルするライブラリーをすごく増やしたのです。（その頃の様子がわかるURLをここに置いておきたかったけど見つけられなかった。。。） Rubyではcsvのようにrequireするだけで使えるライブラリーを「標準添付ライブラリー」と呼んでいます。Stringのようにrequireしなくても使えるライブラリーは。。。なんだろう。組み込みクラスかしら。その後、Ruby 1.9.0のタイミングで実装をFasterCSVに置き換え
kenichiice 2019/03/19
ruby

csv

アルゴリズム

チューニング
リンク
CPU使用率は間違っている | Yakst
Netflixのパフォーマンスエンジニアである筆者からの、topコマンドなどで表示されるCPU使用率(%CPU)は、いまや本当の使用率を表しておらず、チューニングなどのための指標として使えないという指摘。なぜそうなってしまったのか、何を見れば本当のCPU使用率がわかるのかをわかりやすく解説した記事。私たちみんながCPU使用率として使っている指標は非常に誤解を招くもので、この状況は毎年悪化しています。CPU使用率とは何でしょうか？プロセッサーがどのくらい忙しいか？違います。CPU使用率が表しているのはそれではありません。私が話しているのは、あちこちで、あらゆる人たちに、あらゆる監視製品で、あるいはtop(1)でも使われている、"%CPU"という指標のことです。あなたの考えているであろうCPU使用率90% : 実際 : "stalled"(訳注 : 以下ストールと言う)とは、プロセッサーが
kenichiice 2017/06/16
「Linux perfなどを使って読み出せるハードウェアカウンターであるPerformance Monitoring Counters (PMC)を使います」「top(1)に対しては、Linuxではtiptop(1)があり、プロセス毎のIPCを表示してくれます。」

linux

perf

チューニング
リンク
perf + Flame Graphs で Linux カーネル内のボトルネックを特定する - ablog
Linuxでddで1GBのファイルを作成し perf でプロファイリングし、Flame Graph (炎のグラフ？)にして可視化したものです。 Flame Graphs は perf(Linux)、SystemTap(Linux)、DTrace(Solaris、Oracle Linux(UEK)、Mac OS X、FreeBSD)、XPerf.exe(Windows) などでのプロファイリング結果を可視化して最も使われているコードパスを早く正確に特定することができます。実体はプロファイリング結果をグラフ(SVG)に変換する Perl スクリプトです。下から上に行くほどコールスタックが深く、左から関数名のアルファベット順でソートされています。一番上で横幅が広い関数がCPUを長く使っています。今回は "_aesni_enc1" つまり暗号化がボトルネックになっていることがわかります。システ
kenichiice 2015/07/07
チューニング
リンク
高負荷サイトのボトルネックを見つけるには : DSAS開発者の部屋
はじめにアクセスが急増すると、応答時間が著しく悪化するサイトはありませんか？普段は200ミリ秒以内で安定してアクセスをさばいているのに、イベントやらキャンペーンやらを開始した瞬間から、普段の２倍や３倍のアクセスが殺到し、その結果、レスポンスタイムが3秒とか9秒とかかかるようになってしまうことってありますよね。あるサイトの実状つい先日まで、そんなサイトが私の目の前にもありました。自社で運営している某ソーシャル系のサイトなんですが、イベント開始時刻と同時にアクセス数が急増するのです。とはいえ、所詮は普段の2倍とか3倍程度の数なのだから、少なくとも1秒以内にレスポンスを返せるくらいの性能は維持したいものです。しかし実際は困ったことに、応答に3秒以上もかかってしまう処理が大量に発生してしまう状況に陥ってしまっていました。これはきっと、どこかにボトルネックがあるに違いありません。仮説を立
kenichiice 2015/04/24
「ざっくり言うと「異常と思われるパケットだけを表示してくれる tcpdumpみたいなツール」といったところでしょうか。」

network

チューニング
リンク
sprintf を最大10倍以上高速化するプリプロセッサ「qrintf」を作った
最近H2OというHTTPサーバを書いているのですが、プロファイルを取ってみるとsprintfが結構な時間を食っていて不満に感じていました。実際、sprintfは数値や文字列をフォーマットするのに十徳ナイフ的に便利なので、HTTPサーバに限らず良く使われる（そしてCPU時間を消費しがちな）関数です。では、sprintfを最適化すれば、様々なプログラムがより高速に動作するようになるのではないでしょうか。ということで作ったのが、qrintfです。 qrintfは、Cプリプロセッサのラッパーとしてソースコードに含まれるsprintfの呼出フォーマットを解析し、フォーマットにあわせたコードに書き換えることで、sprintfを高速化します。たとえば、以下のようなIPv4アドレスを文字列化するコード片を sprintf( buf, "%d.%d.%d.%d", (addr >> 24) & 0xf
kenichiice 2014/10/02
c

プログラミング

チューニング
リンク
OpenJDK＋SystemTapでトラブル解析はここまでできる！
Javaでデバッグしにくい3つの場面 Javaアプリケーションで構築されたシステムの障害や性能問題が発生した場合、大半はデバッガやプロファイラ、ミドルウェアやサードパーティが提供するツールを用いることで解析できてしまいます。しかし、以下のような状況ではJavaの世界からのアプローチがしにくく、通常のデバッグノウハウが使えないことがあります。プロセス再起動が許されないシステムでの情報取得がしたいとき本番環境でしか発生せず、テスト環境でデバッグできない問題の場合 GC（ガベージ・コレクション）ログ（-Xloggcなど）のように、javaコマンド起動オプションを与えなければ取得できない情報が必要な場合ソース変更が許されない場合に、特定状況下の情報を取得したいときある特定のメソッドなどが実行された瞬間のスレッドダンプやスタックトレースなどが必要な場合ソースの変更ができない、環境の制約な
kenichiice 2013/01/12
java

linux

チューニング
リンク
perfの使いかた
概要 Linuxのパフォーマンス解析ツールであるperfの使いかたの紹介背景個人的にperfよくできてると思うので紹介したいというのと、パフォーマンスカウンタの読み方ってあんまり知られてないみたいなので、それの解説を書きたい。構成 perf について説明したあと、パフォーマンスカウンタの読みかた、見かた、を説明する。 perfとは何か Linuxに付いてくるプロファイラ。 man perf によると、 NAME ---- perf - Performance analysis tools for Linux と、書いてある。名前がひどいのでなんとかしてほしい。 perf の特徴個人的には、手軽に使えるのが素晴らしいと思う。 2.6.31以降カーネルに標準で付いてる。(Ubuntuだとlinux-tools-common(TODO:あとで確認)で入るはず) 特殊な設定が必要無く、
kenichiice 2012/10/24
「Linuxのパフォーマンス解析ツールであるperfの使いかたの紹介」

linux

カーネル

チューニング

profiler
リンク
【レポート】Ubuntu/Fedora 4つのパフォーマンスモニタリングツール | エンタープライズ | マイコミジャーナル
TechThrob.com Three Apps For Monitoring Performance In Linux - Techthrob.comにおいて、Linuxのシステムパフォーマンスを計測するための4つのツールが紹介されている。top(1)と同じように動作するもので、ネットワークトラフィックやIO負荷などをモニタリングするツールが紹介されており興味深い。紹介されているツールは次のとおり。 1. iftop(8) iftop(8)コマンドの実行例 / Ubuntu 10.04 どこのサイトとの通信がどの程度の帯域を消費しているのかを表示するコマンド。「iftop -i eth0」のようにネットワークインタフェースを指定して実行する。通信量はCUIのプログレスバーとして表示される。 2. iostop(1) iostop(1)コマンドの実行例 / Ubuntu 10.04 ディス
kenichiice 2010/07/27
iostop, pv, latencytop

チューニング

top

linux

io
リンク
C/C++プログラマのためのDTrace入門記事一覧 | gihyo.jp
運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。
kenichiice 2010/04/04
c

c++

プログラミング

チューニング
リンク
イマドキのIDE事情第65回 MicrosoftのAjax高速化ツールDolotoを試してみよう! - 新・たけぞう瀕死の日記
kenichiice 2009/10/08
「Dolotoを使えば元のアプリケーションには手を入れず、ほぼ全自動でスクリプトの遅延ロードを実現することができる」

javascript

チューニング
リンク
キャッシュの大きいRDB vs インメモリデータベース、性能がどれだけ違うのか調べてみると
2週間ほど前に「インメモリデータベースがクラウド時代の主流になるという期待」というエントリを書きました。ハードディスクに代わり、メモリをデータベースの永続化手段とするインメモリデータベースは、超高速なアクセスとスケールアウトを実現する、クラウド時代のデータベースの主役になるのではないか、という内容です。この記事に関して、TechVisorの栗原さんと次のようなやりとりをしました。確かに、Oracle Real Application Cluster（以下、Oracle RAC）でデータベースが全部載るくらい十分にキャッシュ用のメモリを割り当てれば、メモリ上でデータベースを操作するインメモリデータベースと同じことではないのか、とも思います。両者の違いは何かあるのでしょうか？調べてみることにしました。インメモリデータベースは1000倍速い調べてみるとすぐに、両者には明確な性能差があ
kenichiice 2009/08/20
「インメモリデータベースではアルゴリズムや構造がメモリ上のデータを扱うのに最適化されていることが、キャッシュを豊富に設定したRDBMSよりも高速な理由だと解説しています。」

db

チューニング
リンク
データベースパフォーマンスに関する、僕が知りうる限り最高の教科書 - レベルエンター山本大のブログ
データベースの醍醐味は、パフォーマンスチューニングにあります。チューニングによっては、同じ処理でも1時間掛かる場合もあれば、 1秒で終わるということもあり得る世界です。僕はDBの魅力に取り付かれた者の一人です。 DBという技術の奥深さが気に入っています。 DBを極めると、どこの現場に行っても絶対に必要とされます。また、どこの現場に行っても正解を導く方程式は一緒なので応用が利くのです。しかし、その基本原理を体系的に学べる手段はあまりありません。 OracleMasterやMCDBAといった資格試験でも学べることは限られていてあとはWebで調べるなりマニュアルを読むなりするしかありませんでした。とくに肝であるパフォーマンスチューニングについては、経験則でチューニングしている部分も多いです。 Oracle、SQLServer、MySQLと色々なDBのチューニングをしてきましたが、
kenichiice 2009/08/09
「データベースパフォーマンスアップの教科書」

チューニング

db

book
リンク
MySQLのEXPLAINを徹底解説!!
以前、MySQLを高速化する10の方法という投稿で「EXPLAINの見方についてはいずれ解説しようと思う」と書いてしまったので、今日はその公約？を果たそうと思う。 MySQLのチューニングで最も大切なのは、クエリとスキーマの最適化である。スキーマの設計は一度決めてしまうとそのテーブルを利用する全てのクエリに影響してしまうためなかなか変更することは出来ないが、クエリはそのクエリだけを書き直せば良いので変更の敷居は低い。そして遅いクエリをなくすことは、性能を大幅に向上させるための最も有効な手段である。従って、アプリケーションの性能を向上させたいなら、まず最初にクエリのチューニングを検討するべきなのである。最適化するべきクエリはスロークエリログやクエリアナライザで見付けられるが、ではそのようなクエリが見つかった場合にはどのように最適化すればいいのか？そのためにはまず現在どのようにクエリが実行さ
kenichiice 2009/04/01
db

チューニング

mysql
リンク
はやいTCPサーバの書き方 - nyaxtのPC作業ログ
cagra高速化にあたってのノウハウを一部公開してみます。また明日校正/更新します。つっこみ待ちです。 select(2)の代わりにepoll_wait(2), kqueue, /dev/epoll等を使う他に山ほど解説ページがあるので略大量のディスクリプタを処理するようなサーバの場合、多少効果があるかもしれません。しかし、クライアント数が少ない場合、劇的な性能の向上は見込めないとおもいます。クライアント数が多い場合は、１セッション１スレッドなモデルではOS側のタスクスイッチングのオーバーヘッドが効いてくることも多いです。クライアント数を増やすには複数のセッションを１スレッドで処理できるようにすると良いです。実装にあたっては、non-blocking ioを活用すると効果的です。 TCP_NODELAYを設定する Nagleアルゴリズムをオフにします。多少応答性が良くなります。これっ
kenichiice 2009/01/11
チューニング

linux

network

socket

tcpip
リンク
IBM Developer
IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.
kenichiice 2008/07/26
java

チューニング
リンク
Linuxアプリケーションの時間計測ツール「TP TimeMeasure」が無償公開 | エンタープライズ | マイコミジャーナル
トライピークスは、組み込みLinuxのアプリケーションソフトウェアのための時間計測ツール「TP TimeMeasure Ver1.0」を開発し、無償での公開を開始した。本ツールはGPL version 2に従ってライセンスされており、同社のWebサイトからダウンロードできる。本ツールは、アプリケーションソフトウェアのプロセスの起動から任意の関数やシステムコール、実効アドレスが実行されるまでにかかった時間を計測できる。main関数よりも前にある関数なども計測可能で、複数の計測ポイントの指定が可能。特定のポイントまでの時間を計測することにより、システム全体の起動時間に占めるアプリケーションソフトウェアの処理時間が把握でき、ボトルネックの特定にも利用できる。対応するプロセッサは、x86とARM(ただしThumbモードには未対応)。本ツールを利用するには、libelf(0.8.6以降)、lib
kenichiice 2008/02/01
linux

チューニング
リンク
1 2 次のページ