[B! インフラ] learnのブックマーク

learn id:learn

インフラに関するlearnのブックマーク (90)

はてなで大規模サービスのインフラを学んだ - ゆううきブログ
中〜大規模サービスのインフラの様子を知りたいアプリケーションエンジニア向けに、もともとアプリケーションコードを書いていた視点から、個人的な体験をベースにはてなで大規模サービスのインフラを学んだ過程や学んだ内容の一部を紹介します。 Webアプリケーションのブラックボックス Webアプリケーションフレームワークの向こう側なぜ複数のサーバが必要なのか突然のWebサービス3層構成リバースプロキシアプリケーションデータベースその他のコンポーネントキャッシュは麻薬飛び道具としてのKVS/NoSQL 非同期処理バッチ処理 Mackerelの場合参考まとめ Webアプリケーションのブラックボックス今年もはてなインターンの時期が近づいてきた。毎年ではないけど、はてなインターンでは「インフラ講義」というのをやっている。今年はインフラ講義の講師としてアサインされたのでちょうど何を話そ
learn 2015/08/01
アーキテクチャ

インフラ
リンク
急増するLINEインフラの課題と対応 « LINE Engineers' Blog
こんにちは。今回はITサービスセンターより、インフラ運営の観点から急増するLINEインフラの課題と対応について記させていただきます。はじめに先日開催したLINE Developer Conference（インフラ編）には大勢の方にいらしていただきました。カンファレンスでは、LINEサービスが始まってから約2年の間に我々はどういった方法でインフラ運営を行い、またどんなことに悩んできたのかを、システム、データベース、ネットワークの観点からそれぞれ発表させていただきました。カンファレンスはLINE株式会社が様々な技術をどのように使い、どのように運用を行っているのか。現在どのような技術的なことに取り組んでいるのか日本のエンジニアの皆さんに知っていただくために開催されました。結果としてインフラ編では150名の定員に対して430名のご応募をいただいたとのことでLINEサービスに対する関心の高さを
learn 2014/05/09
インフラ

ネットワーク

事例
リンク
インフラ系技術の流れ - Gosuke Miyashita
ここ最近のインフラ系技術の流れがおもしろいなー、と思ったので、Puppet が出た辺りぐらいから、振り返って整理してみる。殴り書きなので、後から修正したり書き加えたりするかも。特に後半の方は、あまり考えが整理できてない。最近のウェブ界隈での「インフラ」という用語の使われ方には、色々異論もあるようだけど、ここではごく最近使われるようになってきた、OS からミドルウェアといったソフトウェアレイヤーを指す言葉としてのインフラについて触れる。（英語圏でも同様の意味で使われているようなので、ある程度市民権を得たと言っても良さそうだし。）プロビジョニングレイヤーまず、前提知識としてプロビジョニングレイヤーと自分が勝手に呼んでるものについて整理。 Chef や Puppet は「プロビジョニングフレームワーク」とも呼ばれているが、以下の議論をより厳密にするために、Lee Thompson 氏による
learn 2014/01/02
インフラ

Immutable Infrastructure

動向
リンク
Infrastructure as Code - naoyaのはてなダイアリー
今年の3月に入門Chef Solo - Infrastructure as Code という本を書いた。その名の通り Chef の入門書なのだけど、このサブタイトルは "Configuration Management Tool (構成管理ツール)" でもなく "Provisioning Framework (プロビジョニングフレームワーク)" でもなく、はたまた "Automated Infrastructure (自動化されたインフラ)" でもなく、"Infrastructure as Code" にした。この一年で Chef や Puppet にはずいぶんと注目が集まった。おそらく、AWS をはじめとするクラウドサービスがより広いユーザーに浸透したことで仮想化環境が前提になって、以前よりも頻繁にサーバーを構築し直したりする機会が増えたとかその辺がひとつ理由として挙げられると思う
learn 2013/12/21
インフラ

CI

github flow
リンク
2014年のウェブシステムアーキテクチャ - stanaka's blog
(Monitoring Casual Talk in Kyotoで発表してきたので、ブログエントリにまとめ直しました) 2013年はインフラ周りの技術的な進化が大きく、いくつかのエポックメイキングな概念と実装が産まれました。個人的には特に以下の2つが大きいと思っています。 AWSの本格普及期 DockerとImmutable Infrastructure これらを踏まえて、2014年のウェブシステムの進化の方向性を考えてみます。また、それによるモニタリングへの影響もあわせて考えます。だいぶ長くなってしまったので、急ぐ人は最後に結論をまとめましたので、そちらからどうぞ! 2013年という時代背景 AWSが本格普及期を迎えているのは、言わずもがなのことで、Re:Inventでの246件という膨大のセッション数などにその勢いが表われています。また、DockerはLXC (LinuX Conta
learn 2013/12/01
インフラ

アーキテクチャ
リンク
ITインフラで起きる「もしも」のための12個のコマンド
こんにちは。斎藤です。 ITインフラの障害は、多くの場合「予期せぬ」タイミングで発生します。特に、CPUリソースを多量に消費したり、Disk I/Oが輻輳している場合、その切り分けは困難な状況に陥りやすいものです。そこで、本日はITインフラ、特にOS・ミドルウェアを支えるにあたって、問題解決を助けてくれるであろう12個のコマンドを取り上げてみます。「必ず押さえておきたい」5つのものと「更に覚えると便利なコマンド」7つの2節に分けてお話しします。 ※CentOS 6.4 (64bit)を前提に取り上げます必ず押さえておきたいコマンドもしITインフラ管理者になりたてな方はぜひサーバサイドのプログラマをやっていたのだけれど、ある日突然「君、サーバ管理担当ね！」と、バトンを渡される方っていらっしゃると思います。私も以前はそのクチでした...。そうなってしまったとき、まずは覚えておきたい5つ
learn 2013/10/13
linux

インフラ

コマンド

トラブルシューティン

パフォーマンスチュー
リンク
dfltweb1.onamae.com – このドメインはお名前.comで取得されています。
このドメインはお名前.com から取得されました。お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。
learn 2013/08/22
AWS

インフラ
リンク
最近のサーバの抽象化について - As a Futurist...
学者でもなんでもない現場のいちエンジニアの感想です。しかも、どれもちゃんと使ったことないので、聞きかじりをまとめたメモ書きなので嘘が入ってますが、興味ある方がいればどうぞ。はじめにかつては「OS=物理サーバ」であって、その物理サーバの資源(CPU,RAM,DISK,etc.)をどのように使うかは OS がプロセスに割り振る形で決定されていました。しかし、それでは例えば以下の様な問題があります。ファイルシステム資源をプロセスが自由にコントロールできない ProcA と ProcB で使いたい libfoo のバージョンが異なる場合面倒 CPU, RAM 資源もコントロールしにくい同居してるプロセスがメモリ食い尽くして、みんな死亡、みたいなそもそも異なる OS を同居して使うことができない CentOS ばかり使ってるのに、使いたいライブラリが Debian でしか動かないとか解決
learn 2013/08/09
インフラ

仮想化
リンク
「GREEを支える大規模インフラテクノロジー」-GREE Platform Summer Conference 2012
取締役　執行役員CTO　開発本部長藤本　真樹氏 2005年6月にGREEに入ってから7年が経ちました。 GREEでは開発全般を見ていて、最近はインフラよりもクライアントの方を見ますが、元々はサーバーサイドよりの人間なので、今回こういう話ができて嬉しいです。今回のお題でサーバーサイドに関して話してみては？と言われて、すごく困ってしまった。何故かというと、大規模サービスを普通にやるテクノロジーのコモディティ化が進んだからです。１０倍のユーザーが来た時にどうすればいいのかというのは、インターネット上にいっぱい情報が既にあり、それを支えるオープンソースのプロダクトや、クラウドサービスなど解決策がいくつもある。 Agenda 1.Infrastructure for over 100,000,000users 2.Infrastructure for global ser
learn 2012/08/10
GREE

インフラ
リンク
ソーシャルゲームスケールアウトの歴史
Unityネットワーク通信の基盤である「RPC」について、意外と知られていないボトルネックと、その対策法
learn 2012/02/20
インフラ

アーキテクチャ

資料
リンク
ローカルポートを食いつぶしていた話 - download_takeshi’s diary
ここのところ、お仕事で管理しているシステムで、夜中に負荷が急上昇する事象が発生しており、夜な夜な対応に追われていました。（このブログ書いている今も、負荷がじわじわ上昇中なんですが・・・）で、いろいろと調査した結果、ようやく糸口がわかってきました。結論から言うと、ローカルポートなどのネットワーク資源を食いつぶしていたようです。以下、調べていってわかったことなどのメモです。トラブルの事象運用しているのは Apache2.2 + mod_perl2 なwebサーバで、リスティング広告システムの配信系です。リスティング広告の配信のシステムって一般的にロジックが複雑でいやーな感じなんですが、このシステムもご他聞に漏れずかなりのひねくれ者で、しかもトラヒックは結構多めです。システム全体で、日に1000万〜2000万クエリくらいかな。幸か不幸か、このご時勢においてもトラヒック的には成長し続
learn 2011/08/31
ネットワーク

インフラ

トラブルシューティン
リンク
高負荷サイトのボトルネックを見つけるには : DSAS開発者の部屋
はじめにアクセスが急増すると、応答時間が著しく悪化するサイトはありませんか？普段は200ミリ秒以内で安定してアクセスをさばいているのに、イベントやらキャンペーンやらを開始した瞬間から、普段の２倍や３倍のアクセスが殺到し、その結果、レスポンスタイムが3秒とか9秒とかかかるようになってしまうことってありますよね。あるサイトの実状つい先日まで、そんなサイトが私の目の前にもありました。自社で運営している某ソーシャル系のサイトなんですが、イベント開始時刻と同時にアクセス数が急増するのです。とはいえ、所詮は普段の2倍とか3倍程度の数なのだから、少なくとも1秒以内にレスポンスを返せるくらいの性能は維持したいものです。しかし実際は困ったことに、応答に3秒以上もかかってしまう処理が大量に発生してしまう状況に陥ってしまっていました。これはきっと、どこかにボトルネックがあるに違いありません。仮説を立
learn 2011/07/22
トラブルシューティン

インフラ

性能
リンク
革命の日々！続 @ITのmeminfoの見方の説明が完全に間違っている件について
http://www.atmarkit.co.jp/flinux/rensai/tantei01/bangai01c.html 続く drop_caches の説明も間違ってる 0. デフォルト状態に戻す場合 # echo 0 > /proc/sys/vm/drop_caches と書かれているが、当該箇所のソースは以下である linux/fs/drop_caches.c int drop_caches_sysctl_handler(ctl_table *table, int write, struct file *file, void __user *buffer, size_t *length, loff_t *ppos) { proc_dointvec_minmax(table, write, file, buffer, length, ppos); if (write) { if
learn 2011/07/22
linux

インフラ

メモリ
リンク
Dev Ops at Hatena
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
learn 2011/06/26
インフラ

運用

事例

hatena

資料
リンク
DevOpsカンファレンスに行ってきた - kanblr
DevOpsカンファレンスに参加したのでメモ。渋谷マークシティのサイバーエージェント株式会社の会議室が会場。広い! 快適! WiFiあるという良い会場。ただし駅からマークシティ内の移動が若干カオス(基本的には一本道だけど) この手の勉強会って一時期MacBook(Pro)一色になってたこともあったけど、今日はぼちぼちバラエティに富んでる気がする。MacBook Air(11)優勢か。あとiPad使ってる人もいるなー。冒頭の挨拶。1年越しの企画だったらしい。ウェブオペレーション ―サイト運用管理の実践テクニックの刊行をきっかけに実施することになったとか。最初はmizzyさんの「10分で分かるDevOps」 DevOpsという言葉の成り立ちからインフラ(Opes)側から生まれてきた言葉DevOpsとは、開発者と運用者のより良い関係を築くためのメソッドDevとOpsの境界線で生じる対立をど
learn 2011/06/25
devops

インフラ

事例

hatena
リンク
MySQLをmaster:slave=1:1構成にして参照をslaveに向けるのがなぜ良くないか - 酒日記はてな支店
MySQLのmasterとslave 1:1にして参照をslave向けるのってやりたがる人多いみたいだけど、性能たいして上がらない割に可用性落ちるだけだからやめようキャンペーン 2011-06-19 00:16:30 via YoruFukurou MySQL はレプリケーションが簡単に構成できるのですが、時折 master 1台に対して slave 1台、更新処理は master に、参照は slave に、という構成を目にします。個人的にはこの構成はお勧めでないと思っているので、その理由を考察してみます。 1. 可用性が落ちる当然ですが、master, slave のどちらが落ちても影響を受けるために可用性が低下します。 2. 全体の性能がほとんど上がらない master 1台ですべてのクエリを処理する場合と比べて、可用性が落ちる引き換えとして見合った性能向上が得られるか、という
learn 2011/06/21
mysql

インフラ
リンク
CAP定理 - Wikipedia
CAP定理はブリュワーの定理とも呼ばれ、分散コンピュータシステムのマシン間の情報複製に関する定理。ウェブサービスを想定して作られた定理。定義[編集] ノード間のデータ複製において、同時に次の3つの保証を提供することはできない[1][2]。一貫性 (Consistency) すべてのデータ読み込みにおいて、最新の書き込みデータもしくはエラーのどちらかを受け取る。可用性 (Availability) ノード障害により生存ノードの機能性は損なわれない。つまり、ダウンしていないノードが常に応答を返す。単一障害点が存在しないことが必要。分断耐性 (Partition-tolerance) システムは任意の通信障害などによるメッセージ損失に対し、継続して動作を行う。通信可能なサーバーが複数のグループに分断されるケース（ネットワーク分断）を指し、1つのハブに全てのサーバーがつながっている場合は、
learn 2011/06/21
インフラ

アーキテクチャ

分散処理

用語
リンク
Twitterにおける大規模システム構築、3つの原則
4月に米サンタクララで行われたMySQL Confernce & Expo 211では、TwitterのJeremy Cole氏が「Big and Small Data at @Twitter」と題して、同社のシステムにおける原則とシステム構成について紹介したプレゼンテーションが行われました。 1日に1億5000万以上のツイートが行われているTwitterのシステムはどのように構築されているのか、その内容を紹介しましょう。 Twitterにおける原則 TwitterのJeremy Cole氏。
learn 2011/05/25
事例

twitter

インフラ
リンク
RAIDレベルの話: 1+0と6はどっちが安全か？ - たごもりすメモ
仕事でちょっくら12台のHDDを使ったRAIDアレイを組むんだけど、その折にちょうどTwitterで「RAID-1+0にしないとRAID-6とか怖くて使えませんよ！」というウソ八百な内容のWebページのURLを見掛けたので、いいかげんそのような迷信が消え去ってもよかろうと思って書くことにした。 1重ミラー設定のRAID-1+0は安全性においてRAID-6に劣る。ただし、正しく運用されている場合に限る。*1 知っている人はずっと前から知っている事実ではあるんだけど、某巨大SIerなんかでも高い方が安全に決まってる的な残念な脳味噌の持ち主がいっぱいいて「いやあデータの安全性を考えるとRAID-1+0」とか考えもなしにクチにし、そっちの方がディスクがいっぱい売れて嬉しいストレージベンダーもニコニコしながら否定せず売りつけて去っていくといううわなにをす(ry まあそんな感じで。ちなみに正しくない運
learn 2011/04/21
RAID

インフラ
リンク
arpingのススメ
>>hiroshiの母でございます。このたびは、hiroshiがブログの更新を怠ってしまい、皆様には大変ご迷惑をおかけしております。深くお詫び申し上げます。～中略～どうぞ皆様、hiroshiを暖かく迎えてやってくださいまし。本当は良い子なんです。というわけでご無沙汰しておりますhiroshiです。技術ネタは大変ご無沙汰な感じになっておりまして、これはよくないな、ということでtommyのネタ在庫から多忙な本人に代わり、まーひーな僕がちょいと拝借して代筆させていただきます。さて、今回は最上層でリクエストを受け付けているリバースプロキシ用途のサーバを移動させたいケースなどにおけるTIPSです。 DNSだけ切り替えてもクライアントからリバースプロキシまでの経路のN/W機器のキャッシュはガガッと切り替わってくれないので、元サーバにはリクエストが来続けます。ならば、いっそIPアドレスを移動
learn 2011/04/12
Gratuitous ARP

インフラ

ネットワーク

運用
リンク
1 2 3 4 5 次のページ