GTC 2019でDell/EMC、テキサス大オースチン校とテキサス大サンアントニオ校の研究者が「MLPerf」を使ってディープラーニングのハードウェアインフラの選び方を理解するという論文を発表した。 (このレポートの図は、別の出典を挙げていない場合は、GTC 2019におけるDELL/EMCのRamesh Radhakrishnan氏の発表資料のコピーである) MLPerfベンチマークはマシンラーニングの学習の実行性能を測るベンチマークである。現在、V0.5というものが使われている。MLPerf V0.5では「イメージ分類」、「オブジェクト検出」、「翻訳」、「リコメンデーション」、「強化学習」の5つのドメインがあり、それぞれのドメインの問題に対するマシンラーニングのトレーニングの性能を測定する。 発表を行うDELL/EMCのRamesh Radhakrishnan氏 (筆者撮影) なお、
論文:AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLICATIONS を読んだときのメモCNN はじめに AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLICATIONS を読んだときのメモです。 正確なところは原文をお願いします。<(_ _)> https://arxiv.org/pdf/1605.07678.pdf 論文の概要 ImageNet等のコンペの目的はaccuracyである 一方で、実運用では考えるべき、推論時間は?メモリ使用量は?命令数は?消費電力は?にも着目して、主要CNNについて比較した。 論文には書いていないが知っておくべきこと AlexNet,VGGは全結合層がとにかく重い。 NIN以降、Global Average Po
普段使用しているPCで、わざわざ機能を制限することはあまりありませんが、 制限した場合にどの程度の性能が出るのか確認が必要な場合もあります。 そんな時に役立つTipsです。 今回はマルチコアCPUのコア数を制限する方法です。(コアを1つに制限する場合) 1. Windowの場合 OSの起動設定を変更する a) [スタート]->[ファイル名を指定して実行]を選択し"msconfig"を記入 b) [Boot.ini]タブを選択し[詳細オプション]をクリック c) "/NUMPROC"にチェックし"1"となっていることを確認し、"OK"ボタン を押します d) "適用"ボタンを押し、システムを再起動します e) システムモニタを起動し、CPUが1個になっていることを確認 2. Linuxの場合(Ubuntu 10.04) Kernelの起動オプションに"maxcpus=1"を追加する <オリジ
Linux Tips – HDDベンチマーク手順+性能測定結果一覧(hdparm,dd,bonnie++) システムのパフォーマンスが思うように上がらない場合、ハードディスクのIO性能がボトルネックになっているケースが多く見られます。 システムの環境構築が完了した後には、ハードディスクのIO性能を必ず測定しておきましょう。ここで紹介するHDDベンチマークを実行して、測定結果の妥当性を評価することによって、ほとんどのケースでディスクIO性能に起因する性能問題を未然に検知することが可能です。 ハードディスクのIO性能を左右する要素システムのパフォーマンスが思うように上がらない場合、ハードディスクのIO性能がボトルネックになっているケースが多く見られます。 以下に主要な項目を挙げるように、ハードディスクのIO性能は様々なシステム構成要素やその設定によって左右されます。システムのインフラ基盤で性能
1. 今話題のHadoop HBaseの 性能検証結果と Zabbixによる性能監視のご紹介 日本ヒューレット・パッカード株式会社 テクノロジーコンサルティング統括本部 データセンターソリューション第一本部コアテクノロジー部 石田精一郎 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Confidentiality label goes here 2. お話ししたい内容 • インフラの観点からのHBase • どのように信頼性が確保されているのか • スケールアウトやIOのアーキテクチャ • 性能監視のポイント • 検証の観点とハマりどころ • プロダクトの基本的な特徴、性能特性の確
はじめに 私たちが提供しているSaaS型のWAFサービス、Scutum(スキュータム)では、今年の春に開発環境を物理サーバからEC2へ移行しました。より安い料金でサーバを使用するため、シンガポールリージョンでSpot Instanceを使用しています。価格が非常に安く、また変動幅も少ないことから、お買い得感のあるサーバをかなり安定して稼働させることができています。 今回はこのEC2に開発環境を移行する過程で気がついた、EC2(あるいは、他のIaaS型クラウドサービス)を使用する上で気をつけたい、クラウドのハードウェアについてまとめてみたいと思います。 開発環境の目的 EC2に構築した開発環境の主な目的はパフォーマンステストです。シグネチャのチューニングやエンジン部のコードの変更などによってシステムのスループットにどのような影響が出るのかを常に把握しておくため、安定した環境が必要となります。
by Adrian Cockcroft Today AWS has launched a new Solid State Disk (SSD) based instance that addresses the need for high performance I/O, and we have run a few initial benchmarks to see how it shapes up. With this announcement AWS makes it easy to provision extremely high I/O capacity with consistently low latency. AWS has been competitive in instance memory capacity for a long time and is leading
Using Intel.com Search You can easily search the entire Intel.com site in several ways. Brand Name: Core i9 Document Number: 123456 Code Name: Emerald Rapids Special Operators: “Ice Lake”, Ice AND Lake, Ice OR Lake, Ice* Quick Links You can also try the quick links below to see results for most popular searches. Product Information Support Drivers & Software
SSD Crucial「RealSSD C300 64GB」の性能 概要 『CTFDDAA064MAG-1G1.002』は、2.5型で64GB(実質60GB)の容量のSSDです。ファームウェアは002でTrimコマンドに対応したMarvell製のコントローラが搭載されています。 Crucial「RealSSD C300」は搭載する容量によって書き込み性能が異なります。 256GB: Read 355MB/s Write 215MB/s 128GB: Read 355MB/s Write 140MB/s 064GB: Read 355MB/s Write 075MB/s SSDでは小さな容量のチップを複数搭載することで大容量にしていますが、RAID 0のように並列に繋げることで処理を分散させて速度が高まります。そのため、チップ数が少なくなるほど性能が低くなるSSDが多いです。 C300の読込
MongoDBの方が好きなんですが、CouchDBのパフォーマンスも見てみました。viewを作るところとかのパフォーマンスは見ていないので、厳密な比較にはならないかもしれませんが、ある程度の傾向とか、感覚は分かると思います。CouchDBとか、MongoDBって何じゃ?と言う人は、ASCIIのHadoop & NoSQLを読めば分かるかも。今回はmemcached、MongoDB、CouchDBの3つについて比較しました。memcached、mondodbのコードは以前のものを使っています。 Memcachedのコード MongoDBのコード CouchDBのコード データの追加はmemcacheやmongodbが0.2ミリ秒弱の時間です。memcacheはオンメモリなので当たり前ですが、mongoはディスクへの書き出しが遅延されているのでmemcacheに迫るスピードになっているのでしょ
読み込みの場合、ONEではコピーを持つ全ノードに一斉に読み出し要求を出し、最初に返ってきたデータをアプリケーションに渡す。QUORUMは過半数のノードから返答が来た時点で、最も新しいタイムスタンプを持つデータを渡す。ALLは全ノードの返答から最新データを選ぶ。 制御方式の組み合わせで性能高まる 検証の結果、最も性能が高かったのがONEで、最低のALLと比較した結果が2.2倍だった。データの一貫性の高さよりも、性能向上を優先する場合は、ONEを選ぶのが有効だ。 ただし実際に性能向上を重視し、読み出しと書き込みの両方でONEを選ぶと、アプリケーションは想定した動作をしない恐れがある。検証用アプリケーションで、ショッピングサイトの商品閲覧履歴をONEで書き込むと、まず1台のサーバーにデータが書き込まれ、コピーが残りの2台に書き込まれるのはその後になる。ONEを使った読み出し要求が書き込みの直後に
Cassandraのスループットの変化を調べた結果を図2に示した。Cassandraのノード(サーバー)数が2、4、6台のそれぞれにおいて、実行する検証用アプリケーションのスレッド数を徐々に増やした。各スレッドで、書き込み、または読み出しを繰り返し実行し、スレッド数を増やしていくことで、Cassandraの負荷を高めていった。 Cassandraに対する負荷を高めていくと、スループットは曲線を描いて向上していくことが分かった。負荷の増加に対して、十分に性能が向上しなくなったポイントを探し、2、4、6ノードの場合を比較した。検証用の機器は、プリファードインフラストラクチャーから貸与を受けた まず分かったのは、アクセス負荷を高めたとき、Cassandraのスループットは曲線を描いて、向上していくことだ。RDBなど多くのデータベースは負荷を高めていくと、スループットはほぼリニアに伸び、あるしきい
by Adrian Cockcroft and Denis Sheahan Netflix has been rolling out the Apache Cassandra NoSQL data store for production use over the last six months. As part of our benchmarking we recently decided to run a test designed to validate our tooling and automation scalability as well as the performance characteristics of Cassandra. Adrian presented these results at the High Performance Transaction Syst
Cloudera Distribution Including Apache HadoopがオラクルSun x2270クラスターより81%高速を実現 米カリフォルニア州フリーモント--(BUSINESS WIRE)--(ビジネスワイヤ) -- 信頼される技術コンピューティング大手のSGI(NASDAQ:SGI)は本日、Cloudera’s Distribution Including Apache Hadoop(CDH)で動作するApache Hadoopクラスターを使用したTerasortベンチマークのデータ処理・分析で世界新記録を達成したと発表しました。クラウデラ・コネクト・パートナー・プログラムに最近参加した当社はまた、クラウデラと販売提携関係を構築したことを別に発表しました。この提携関係により、当社はHadoopベースあるいはHadoop関連の商用ソリューションを開発・販売・展開す
Benchmarking Cloud Serving Systems with YCSB Brian F. Cooper, Adam Silberstein, Erwin Tam, Raghu Ramakrishnan and Russell Sears Yahoo! Research {cooperb,silberst,etam,ramakris,sears}@yahoo-inc.com DRAFT: Submitted for publication ABSTRACT While the use of MapReduce systems (such as Hadoop) for large scale data analysis has been widely recognized and studied, we have recently seen an explosion in
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く