PyDataTokyoに触発されたので、Kaggleで上位を取るための戦略、そして神々に近づくための学習戦略を考えてみました。 kaggle master (自慢)ではありますが、kaggle歴は浅いので、いろんな突っ込みどころがあると思います。 1. 初参加 ~ top25% まずはtitanicのtutorialを始めてみる 終わったら、ちゃんとポイントのもらえる本番コンペに参加する お遊びコンペだとなかなか気合いが入らないので(人によります) いろんなコンペがあるが、とりあえず興味があるのに参加してみる 無理そうならあきらめる beat the benchmark(btb)というのがForumに出てくるので、まずはbeat the beat the benchmarkを目指す。これができればtop25%とか行けるのではなかろうか。 ツールの使い方を覚える良い機会 btbは特徴量をそん
一応、立場的には第三者に戻った(MySQL/InnoDBの性能追求が仕事ではない)ので、忘れられない暗い過去にも触れてみようと思います。 未だに騙されている人が多いみたいなので、MySQL/InnoDBの名誉のために書き残さなければなりません。何度でも言いますが、性能比較は自分の目的とする処理をちゃんと比較しないとだめです。そうでなくては、騙されて本当は悪い性能のものを掴まされることになります。 DBT-2と言う(TPC-Cをベースにした)ベンチマークがありますが、数多のRDBMS(商用/OSS双方)に対して独自にTPC-Cベンチマークを実装・チューニングして比較した経験のある私から見て、怪しい結果しか出ないので、長年、基本無視のスタンスを取っています。 が、3年前にあろうことかMySQLの性能QAがDBT-2(nonsp:mysql)を利用していて、とある性能FIXに対して問題を指摘して
「PostgreSQL」はエンタープライズでどこまで使える? ”SIエンジニア連合”が技術検証:Database Watch(2015年6月版)(1/2 ページ) 商用DBからPostgreSQLへの移行ノウハウを「普段は競合」に所属するITエンジニアらが合同で検証した成果は? 9.4での性能評価資料の他、移行プロセス検証なども。 2015年5月14日、PostgreSQLエンタープライズコンソーシアム(以下、PGEC)は毎年恒例となる活動成果発表会を行いました。今年で3回目の開催となり、活動成果としてまとめたノウハウも充実してきました。過去の活動成果報告は「PostgreSQLは80コアまでリニアに性能アップする」などで紹介した通りです。 もともとPGECには業務で商用RDBMSを使っていた企業が多く参加しています。商用RDBMSの機能や性能には満足していても、ライセンス費用の高さやベン
By Kārlis Dambrāns サムスン電子のGALAXY Note 3は、有名なベンチマークソフトを起動した際にテストの結果を不正に操作する「ベンチマーク・ブースター」を動作するようにプログラムされていることが発覚したわけですが、AnandTechが調査した結果、GALAXY Note 3だけに限らず、Androidを搭載しているほとんどの端末にベンチマークを最適化するチートが発見されました。 AnandTech | They're (Almost) All Dirty: The State of Cheating in Android Benchmarks http://www.anandtech.com/show/7384/state-of-cheating-in-android-benchmarks 下記の表は、ベンチマークソフト「3DM」「AnTuTu」「AndEBench
http://d.hatena.ne.jp/babydaemons/20110629/JavaScript_without_Math_floor_function を読んでなんとなくやりたくなったのでやります。 ご存知の通り、Javascriptでもビット演算はできます。 一般にビット演算は通常の四則演算よりも高速だと思われますので使えるところでは積極的に使っていきたいところであります。 よく知られている整数化の手法としては以下のようなものがあります。 // 論理積 var int = float&-1; // 論理和 var int = float|0; // 排他的論理和 var int = float^0; // 2回の補数算出 var int = ~~float; // 0回のビットシフト var int = float<<0; // Math.floor() var int =
ツイッターはリアルタイムが看板のソーシャル・ネット・サービス。だが、高速応答性と稼働率では、フェイスブックがツイッターを完全に凌いでいる。 SmartBear Softwareは、主要ソーシャル・ネットワーキング・サイトの応答時間(response time)と稼働率(availability)を定期的に測定している。このほど2011年第3四半期(7月~9月)のデータが出てきたので、1年前のデータと共に紹介する。 まず応答時間である。2011年第3四半期においては、フェイスブックの応答時間が0.73秒で、ツイッターの2.73秒に比べ圧倒的に短い。フェイスブックのユーザー数が5億人を超えた1年前の応答時間が1秒であったのが、ユーザー数が増え続けて8億人を突破した現時点において、さらに0.27秒も短くなり0.73秒と1秒を割ったのだから立派である。ツイッターの応答時間も1年前の2.93秒から2
重複した要素をユニークにする代表的な方法としていくつかある。 ふと、どのコードが速いのか気になったのでベンチマークを取ってみました。 今回調べたコードは以下の6種類 # use Array::Uniq; sub unique_au{ my @array = @_; return uniq sort @array; } # foreach sub unique_each{ my @array = @_; my %hash; $hash{$_} = 1 foreach(@array); return keys %hash; } # grep sub unique_grep{ my @array = @_; my %hash; return grep{!$hash{$_}++} @array; } # use List::MoreUtils; sub unique_lmu{ my @array
JSONの発見者でJavScript界の重鎮であるYahoo!のダグラス・クロックフォード(Douglas Crockford)氏。米オライリーが主催するイベント「Velocity 2011」で、セッション「JavaScript & Metaperformance」を行いました。 いまWebブラウザ間でJavaScriptエンジンの性能競争が行われていますが、その影響とこの先の展望について語っています。JavaScriptプログラマなら必見の内容を、公開されたビデオを基に紹介しましょう。 JavaScript & Metaperformance これから、JavaScriptと性能についての本当の話をしよう。 JavaScriptはみなさんご存じかな? いまや世界で最もポピュラーになったプログラミング言語だ。 JavaScriptは、Javaからシンタックスを、Schemeからファーストク
Welcome to the Netperf Homepage From here you can retrieve information about netperf and the performance of systems running the netperf benchmark. You can also submit performance results for the benefit of the rest of the netperf community. Netperf has migrated to GitHub! This website was also migrated in an effort to preserve any important historical documentation. Links have been updated and cle
Ruby ではメソッドの最後の式の値がそのまま返り値になります。どこで読んだのか忘れてしまいましたが「明示的に return を書くとちょっとだけ遅いので、不要なら明示的な return を書かずに返り値の式だけ書くのが Ruby 流」という言説があって、その当時試してみると確かに明示的に return を書かないほうがちょっと速いという結果だったので「不要なら明示的な return は書かないのがジャスティス」というのを信条にしてきました。 しかし先日その話をしていて、ふと 1.9 ではもうこの"常識"は通用しなくなってるんじゃないかと思いついたので確認してみました。 benchmark に使ったスクリプトと実行結果は gist に置きました。 https://gist.github.com/935934 明示的な return の有無と、さらに block の中から return する
[NEW] gmp-4.2.3とgmp-4.2.4は見送り[20081007] ライブラリのコードを精査した所、円周率の処理速度に影響を与える改良が されていなかったため、ベンチマーク利用は見送ります。 はじめに そもそもは、円周率計算のプログラムをケースにしてGMPの能力の限界はどれ くらいかということを試していたのだが、手段が目的化してしまい、そのなれ の果てがこの結果である。 まずは小数点以下100万桁までを求めてみる 準備 GMP (GNU Multi-Precision)ライブラリを使うが、ディストリビューションの デフォルトでついてくるライブラリは遅い。正確に言うと、使っているハード ウェアに最適化していない汎用の環境を前提にライブラリはコンパイルされて いるため、さらに最適化することができる。 GMPのソースコードを入手する ( http://gmplib.org/
Firefox 3.5 Preview(3.5b99, ID:20090605162636)がリリースされたばかりだが、そのコードはほぼ完成に近く、性能面でPreviewと正式版の差は小さいと考えられる。今回はこのプレビュー版を使ってパフォーマンスを検証したい。 比較対象の第一グループとして、Firefox 3.5 Beta 4(ID:20090423204732)とFirefox 3.0.10(Gecko/2009042316)を用意した。従来は開発版であるShiretoko Nightlyをベースに計測していたが、リリース版どうしで速さを比べるのも悪くない。また、大多数のユーザーの関心は、Firefox 3と比較してどうかという点に絞られよう。そこで、現時点におけるFirefox 3の最新版をもってきた。 比較対象の第二グループは、Google Chrome(2.0.172.30, A
当エントリーは多くの誤りを含んでいます。参考にされる場合は最後の追記部分まで含めて読まれるようにお願いします。 それなりに慣れているはずのプロのプログラマでも、このような勘違いや大失態をすることがあるという教訓として残すために、エントリーの削除や修正はせずに追記のみに留めておきます。 JavaScriptで、配列に要素を追加するメソッドに、push、unshift、splice、concatがある。このうち、配列の後方に要素を追加するのは、(要素を好きな場所に追加可能なspliceを除くと)pushとconcatの二つである。この二つのメソッドは破壊的/非破壊的の違いがあれ、似たような挙動を示す。
JRuby - Java powered Ruby implementation JRubyの開発者であるCharles Nutter氏が自身のブログにおいてHow JRuby Makes Ruby Fastのタイトルのもと、JRubyのパフォーマンス計測結果を報告している。Charles Nutter氏は竹内関数の一種であるTak関数を使ったベンチマークを例に取り上げ、インタプリタモードから最適化が実施されたコンパイルモードの動作までをまとめている。紹介されているデータをまとめると次のとおり。 実行環境 実行時間[s] Ruby 1.8.6p114 18.22 Ruby 1.9.1p0 3.61 JRuby 1.3.0-dev, interpreted, client VM 26.81 JRuby 1.3.0-dev, interpreted, server VM 8.00 JRuby
DBT-2とはTPC-Cライクなオープンソースのベンチマークソフトで、OLTP系の負荷を擬似的に作り出すように設計されている。細かい更新系の処理を測定したい時には便利なベンチマークツールである。しかしながら、DBT-2の実行手順は多少面倒くさく、さらにREADMEには偽の(?)情報まで含まれている上にDBT-2の実行手順はあまりWeb上では解説されていない。そこで、今日は簡単ではあるがDBT-2によるベンチマークのやり方を紹介しよう。(以下の例では利用するデータベースをMySQL、DBT-2のバージョンを0.40であると仮定している。) 1. ダウンロード次のページからDBT-2をダウンロードしよう。 http://osdldbt.sourceforge.net/ 2. 補助パッケージのインストール以下のperlパッケージ類はconfigureスクリプトでは「足りないよ」と言ってくれないの
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く