[B! availability] dannのブックマーク

http://linux-ha.osdn.jp/wp/wp-content/uploads/whats_ha.pdf

dann 2019/10/02

availability

リンク

目指せ！落ちない高可用性サーバ、ハードウェアの選び方 - Qiita

10年以上金融機関で働いているインフラエンジニアの落ちないサーバにするための考察です。ハードウェアの専門家ではないので、正確ではないかもしれません。今までの経験からの個人的考え方になります。私たちオンプレ重視のインフラエンジニアは、クラウドサービスではできない高可用性サーバを導入したり、複数台構成で１台故障しても問題ない構成のサーバはコスト重視するなど、システムに最適なサーバを導入しようとしています。高可用性サーバを追求する目的 ■アプリに影響を与えないように Active/Standby構成にしていて、インフラ的にはダウンタイムが数秒だとしても、アプリによっては復旧に時間がかかったり、問題ないことの確認にも時間がかかってしまいます。また、正しくサーバが落ちればアプリが問題ないとしても、サーバが中途半端な状態のままになってしまい、なんだかおかしいということもあります。

dann 2019/10/02

availability

リンク

Riak: 本物の高可用性を実現する仕組みとは？

YouTube nnabla channelの次の動画で利用したスライドです。【学会聴講報告】CVPR2024からみるVision最先端トレンド https://youtu.be/AvUq4AvQW6M CVPR2024で採択された論文のトレンド分析と、その中からpickup topicsである基盤モデルの動向と3D Visionに関する内容を解説しています。

dann 2014/07/04

リンク

How Google Backs Up the Internet Along With Exabytes of Other Data - High Scalability -

« Sponsored Post: Logentries, Booking, Apple, Mongo DB, BlueStripe, AiScaler, Aerospike, LogicMonitor, AppDynamics, ManageEngine, Site24x7 | Main | Stuff The Internet Says On Scalability For January 31st, 2014 » Raymond Blum leads a team of Site Reliability Engineers charged with keeping Google's data secret and keeping it safe. Of course Google would never say how much data this actually is, but f

dann 2014/02/12

リンク

ゴシッププロトコルによる冗長化と負荷分散の検証

ゴシッププロトコルによる冗長化と負荷分散の検証 - Download as a PDF or view online for free

dann 2013/10/28

availability

リンク

GitHub availability this week

EngineeringGitHub availability this weekGitHub.com suffered two outages early this week that resulted in one hour and 46 minutes of downtime and another hour of significantly degraded performance. This is far below our standard… GitHub.com suffered two outages early this week that resulted in one hour and 46 minutes of downtime and another hour of significantly degraded performance. This is far be

dann 2012/09/20

リンク

Summary of the AWS Service Event in the US East Region

July 2, 2012 We’d like to share more about the service disruption which occurred last Friday night, June 29th, in one of our Availability Zones in the US East-1 Region. The event was triggered during a large scale electrical storm which swept through the Northern Virginia area. We regret the probl ems experienced by customers affected by the disruption and, in addition to giving more detail, also w

dann 2012/07/04

リンク

「エラー忘却型コンピューティング」なんて言い出したのは誰だ！ - Plan9日記

正確にはFailure-oblivious computingを「エラー」忘却型コンピューティングって訳したのは誰だという話。訳す過程でfailureがerrorに入れ替わっている。情報系の人間は「名前重要！」とか言う割に、障害（fault）、異常（error）、故障（failure）という用語の定義、使い方に無自覚な人が少なくない。Twitterで意外と反応があったので、（自戒を込めて）書き起こしてみる。 Failure-oblivious computingは、2004年のOSDIでMITのMartin Rinardらが論文"Enhancing Server Availability and Security Through Failure-Oblivious Computing"で提案した技術。Cのような言語で不正ポインタ参照が発生しても、これを検出してなかったことにして（適当な値を

dann 2012/04/22

リンク

絵で見てわかる某分散データストア

Python Developers Festa 2012.03 での発表スライドです。Read less

dann 2012/03/18

availability

リンク

Oracle |クラウド・アプリケーションとクラウド・プラットフォーム

Oracle DatabaseWorld の全セッション動画が日本語字幕付きにて視聴いただけます。自然言語による問合せ、AIベクトル検索、True Cache, JSON Duality, OCI GoldenGate Stream, GoldenGate 23ai, SQL Firewall, 23aiの高可用性、など様々なトピックを扱っています。

dann 2011/11/19

リンク

Using Gossip Protocols for Failure Detection, Monitoring, Messaging and Other Good Things - High Scalability -

When building a system on top of a set of wildly uncooperative and unruly computers you have knowledge probl ems: knowing when other nodes are dead; knowing when nodes become alive; getting information about other nodes so you can make local decisions, like knowing which node should handle a request based on a scheme for assigning nodes to a certain range of users; learning about new configuration

dann 2011/11/15

リンク

■まえがきこのたび、特定非営利活動法人エルピーアイジャパンは、Linux/OSS 技術者教育に利用していただくことを目的とした教材、「高信頼システム構築標準教科書　― 仮想化と高可用

■まえがきこのたび、特定非営利活動法人エルピーアイジャパンは、Linux/OSS 技術者教育に利用していただくことを目的とした教材、「高信頼システム構築標準教科書　― 仮想化と高可用性 ―」を開発し、Web 上にて公開し（URL： http://lpi.or.jp/linux text/ha.shtml ）、無償提供することとなりました。この「高信頼システム構築標準教科書　― 仮想化と高可用性 ―」は、大手 IT ベンダーをはじめとする多くの企業からの、「Linux/OSS を使った高信頼システムを構築するための実践的なガイドブックが欲しい」という要望に応えて開発されました。クラウドサービスやプライベートクラウドの利用が拡大する中、クラウド基盤をはじめとするミッションクリティカルシステムでの Linux/OSS のニーズはますます高まっています。中でもクラウド基盤構築

dann 2011/06/09

リンク

HDFS block replica placement in your hands now!

dann 2010/11/18

リンク

PowerPoint Presentation

2009/2/24 1 ScalabilityとAvailability 早稲田大学丸山不二夫はじめに  クラウド技術の最大の特徴は、安価なサーバを沢山並べて処理能力を拡大するという Scale-outの戦略である。  このことは、多数のマシンからなるScale-out のシステム構成では、システムを構成するマシンのエラーが、確率的には避けられないことを意味している。  これは、システムのAvailabilityにとっては、重大な問題である。はじめに  講演では、分散システムでは、Scalabiltyと Availabilityが矛盾するということから出発して、現在のクラウドシステムが、どのように、 Scalabilityと Availabilityを両立させようとしているかを見ていく。はじめに  クラウドのAvailabilityは、基本的には、マシン

dann 2010/11/10

availability

リンク

HA構成と復旧作業時間と信頼性 - kazuhoのメモ置き場

２台でHAノードを組んでいて１台が落ちた場合に、何時間以内に再度２台構成に復帰させる必要があるのかなーと思って、ちょっと計算してみた。ノード毎の障害発生の確率が独立であると仮定すると、 $ perl -le 'print exp(log($ARGV[0])/(365*24))**$ARGV[1]' 0.97 1 0.999996522927565のように、サーバの障害発生率が 3%/year で、かつ復旧に１時間かかる場合、復旧中に残存ノードにも障害が発生してサービスが停止する可能性は 0.001% 以下。 $ perl -le 'print exp(log($ARGV[0])/(365*24))**$ARGV[1]' 0.97 24 0.999916553598325２台構成に戻るまで24時間かかる場合だと、約0.01%。 $ perl -le 'print exp(log($ARGV[

dann 2009/10/13

リンク

はてなブックマーク

タグ

関連タグで絞り込む (14)

availabilityに関するdannのブックマーク (15)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス