タグ

運用に関するtkmcのブックマーク (108)

  • HDD故障率のメーカー・モデル別統計データ2021年版、故障率が最も高かったのは?

    クラウドストレージサービスを提供するBackblazeが、自社のデータセンターで使用している20万台以上ものHDDの故障率をまとめたデータの2021年版を公開しました。 Backblaze Drive Stats for 2021 https://www.backblaze.com/blog/backblaze-drive-stats-for-2021/ Backblazeは2021年だけで4万460台もの新たなHDDを追加し、2021年12月31日の時点で合計20万6928台ものHDDを管理していたとのこと。このうち、ブートドライブとして使用されていたものやテスト用に使用されたものを除いた、合計20万2759台のデータドライブに焦点を当てて、BackblazeはHDDの故障率を算出しました。 2021年1月1日~2021年12月31日のHDD故障率をモデル別で示したものがこれ。運用してい

    HDD故障率のメーカー・モデル別統計データ2021年版、故障率が最も高かったのは?
  • 初期Twitterのシステムダウンを救ったのは「グラインディング」 | Coral Capital

    ブログはニューヨークのベンチャーキャピタルUnion Square Venturesでパートナーを務める、Fred Wilson(フレッド・ウィルソン)氏のブログ「AVC」の投稿、「Grinding」を翻訳したものです。 何か魔法のような手法があって、それさえ見つければ、全てが解決すると人は思いたがるものです。セールス担当の新しいVP、技術スタックに加える新しいデータベース層、会社の新ブランド、クラウドへの全面移行、事業のための追加資。 しかし、ビジネスの成功に必要なことが1つだけということは、ほとんどありません。あらゆることを、少しずつやる必要があるのです。 Twitterの初期、私たちはウェブサイトやAPIをダウンさせずに運営することができませんでした。何人もアドバイザーを雇い、そのたびに新たな提案を受けて試しましたが、それでもサイトはダウンしました。フラストレーションは強く、事業

    初期Twitterのシステムダウンを救ったのは「グラインディング」 | Coral Capital
  • aspect ログ:So-netブログ

    アスペクトログ:大阪・尼崎で活動する デザインオフィス_ASPECT DESIGN を、いろんな側面からご案内したいと思います。 MAC遍歴【その7】です。   →→【その1】【その2】【その3】【その4】【その5】【その6】はこちら いやぁ、11月は MAC 受難の月になってしまいました。 ご覧のようなカーネルパニックの嵐。 MAC では、少し不安定になると「爆弾」を頻発していた OS9 までのシステムに比べると、UNIX ベースとなった OSX は極めて牽牛で、まずパニクることなどはありませんでした。 実際、2003年に OSX に移行して以来、システムがエラーを起こした経験は皆無でしたが、今月に入って突然、メインマシンの G5がカーネルパニックを頻発、続いて サーバーとして6年間無停止で運用してきた MAC mini G4 も起動不能に陥るなど、こちらがパニックになってしまいました。

  • 深層学習を実運用システムに組み込むということ / To incorporate deep learning into actual operation system

    Data Driven Developer Meetup #5 (2019.3.7) の発表資料です スライド中のリンクを参照したい場合はPDFをダウンロードすると便利です。

    深層学習を実運用システムに組み込むということ / To incorporate deep learning into actual operation system
  • 夏本番を迎える前に エアコンの“正しい試運転” ダイキンが呼びかけ

    ダイキン工業が、真夏のエアコンシーズンに向け、故障やトラブルを防ぐための試運転と点検方法について案内している。例年7月にエアコンに関する故障の問い合わせや点検依頼が集中するため、同社は5月~6月前半の試運転を呼びかけている。 試運転は(1)運転モードを「冷房」に、温度を最低温度(16~18度)に設定し、10分程度運転、(2)冷風がきちんと出ているか、異常を示すランプが点滅していないかを確認、(3)さらに30分程度運転し、室内機から水漏れがないかを確認、(4)異臭や異音がないか確認、という順で行うという。 同社によると、外気温が低い初夏に試運転する方がエアコン内部に負荷がかかりにくく、製品にも環境にも優しいので適切としている。室内機だけでなく、室外機の動作確認も必要だ。 節電方法についても、(1)2週間に1度のフィルター清掃、(2)設定温度の目安を28度に、(3)室外機の周囲に放熱を妨げる障

    夏本番を迎える前に エアコンの“正しい試運転” ダイキンが呼びかけ
  • 運用自動化、不都合な真実 // Speaker Deck

    ssmjp 201712 はたのさん祭での「運用自動化、不都合な真実」の発表資料です。 詳細: https://www.opslab.jp/publish/20171212-ssmjp-automation.html (運用設計ラボ合同会社 波田野裕一)

    運用自動化、不都合な真実 // Speaker Deck
    tkmc
    tkmc 2017/12/13
  • Apple(Mac,iPad,iPhone)対応 Active Directory連携 改修サービス | ピクチャーコード株式会社:東京-新宿

    アップル製品に企業ポリシーを適用。 Win&Mac,iPhone, iPad 混在環境をActive Directory連携で集中一括管理。 異種OSを一括することで管理の苦労を一気に削減、管理ミスも排除しましょう。 既に導入しているActive DirectoryでMacも一元管理したい! エンタープライズ環境で導入が進んでいるマイクロソフト社のWindows Serverで構築するActive Directoryサービスは企業の管理者から見ると大変便利な仕組みです。 社内のネットワーク上に存在する様々な資源やユーザの情報を一括してWindowsクライアントに設定、構成の自動化、ユーザ環境の標準化を行うことが可能になるため、情報セキュリティの強化が要求される現在では、安全な企業システムを構築するために必須の機能となりました。 既に多くの企業でWindowsクライアント管理のために、Act

    Apple(Mac,iPad,iPhone)対応 Active Directory連携 改修サービス | ピクチャーコード株式会社:東京-新宿
  • 人工知能は WEBサーバの暗闇を救う 松本亮介 #ipsjone / JPSJ-ONE 2016 matsumotory

    Webサービスのシステム管理で疲弊している人々を救いたい話

    人工知能は WEBサーバの暗闇を救う 松本亮介 #ipsjone / JPSJ-ONE 2016 matsumotory
  • フレクトのクラウドblog(New): AWS Lambdaを使ってEC2料金を節約する

    エンジニアの佐藤です。こんにちは。 毎月のAWS(Amazon Web Service)の請求書を眺めていると、気が付くことがあります。請求金額のかなりの部分が「CPU料金」なのです。 EC2として直接買っているCPUだけでなく、Redshift、ElastiCache、RDSなどや、DynamoDBの帯域予約分もこれに該当するでしょう。何にせよ「CPUを構える」ことは、ストレージを構えるのに比べて高くつくのです。 一方で、こうして構えたCPUがどの程度仕事をしているのかというと、結構「暇」していることが多いのではないでしょうか。暇であろうとなかろうと、料金はかかります。 そんな折、AWS Lambda(以下Lambda)にスケジュール実行機能が追加されました。つまり「定時ジョブ」を、CPUを待機させることなく仕掛けることが可能になったのです。今回はこのLambdaを使って、EC2「夜間自

    フレクトのクラウドblog(New): AWS Lambdaを使ってEC2料金を節約する
  • テスラのソフトウェアアップデートとどんどん賢くなるロボットカーの集合知

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Tesla Motor(Tesla)からModel S用ソフトウェアの新バージョン(Version 7.0)が米国時間10月14日にリリースされて(*1)、米国のIT系媒体などではこの話題が割と大きく取り上げられていた(*2)。「iOSの新バージョン発表並み」とまではいかないが、それでもかなりの注目度の高さに思える。また、CNETUSA Todayのように、なかには目玉機能とされる「自動走行機能」の様子を動画入りで伝えているところもある。 こういう「手放し運転(?)の映像」というのは、今月初めに首都高を走るトヨタ車の内部の様子とかがニュースで流れていた矢先でもあり、それほど目新しい感じもしない。 ただ、自動車メーカー関係者以外の人間=

  • 運用を楽にするためのアプリケーションコードを書くということ : sonots:blog

    運用を楽にするためのアプリケーションコードを書くということ : sonots:blog
  • Pinterestはいかにスケーラビリティと格闘してきたのか(後編)。QCon Tokyo 2013

    4月23日に都内で開催されたエンジニア向けのイベント「QCon Tokyo 2013」。急速に人気サイトへと成長したPinterestが、その裏でいかにスケーラビリティと格闘してきたのかをPinterestエンジニア自身が紹介するセッション「Scaling Pinterest」が行われました。 この記事は「Pinterestはいかにスケーラビリティと格闘してきたのか(前編)。QCon Tokyo 2013」の続きです。 クラスタリングは怖い スケーラブルなシステムで問題なのは、データベースがひとつのサーバに収まらなくなったときにどうするのか、ということだ。 例えば、Cassandraは自動的にスケーリングしてくれて設定も簡単。可用性も高く単一障害点はない。しかし障害はそれでも起こるもので、クラスタリングの技術はまだ枯れておらず基的に複雑なものだ。コミュニティもまだ十分ではない。 私たち

    Pinterestはいかにスケーラビリティと格闘してきたのか(後編)。QCon Tokyo 2013
  • ビルドプロセスの自動化で効率アップ

    Grunt.jsの紹介スライドです。package.jsonの扱いや、grunt自身の0.4.0対応が弱い部分が残りますが、数ヶ月前というところでご容赦くだされば、おおまかな概要を示しています。

    ビルドプロセスの自動化で効率アップ
  • Yahoo! JAPANの爆速連絡ツール

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、インフラを担当しています鈴木秀典です。 入社以来、数年に渡ってオークション、ショッピングなどのサービス開発、運用を担当していましたが、昨年インフラ部門に移り、今はヤフー全体のシステム監視、可視化をはじめ、オペレーションエンジニアが抱える共通的な課題の解決につとめています。 このたび、障害時の電話連絡を自動で行うシステムを構築したので、ご紹介したいと思います。 休祝日や夜間などに、営業部門からシステム担当者に連絡を取る際、なかなか担当者をつかまえられなかったり、大きなサービスの場合は、担当者を一発で引き当てられず連絡に時間をかけてしまうことがありました。 連絡を受けるシステム担当者の立場からは、少し遅れて連絡が入っていた

    Yahoo! JAPANの爆速連絡ツール
  • Dozens(ダズンズ)| DNSサーバーのレンタル

    Dozensサービス終了のお知らせ 長年ご愛顧いただきました、当サービス「Dozens(ダズンズ)」は、2019年11月30日(土)を持ちまして、全てのサービス終了させていただきました。 ご利用いただきましたお客様には日頃より当サービスをお引き立ていただき、誠にありがとうございました。 なお、運用中のDNSサーバー※1に関しましては、2019年11月30日(土)以降弊社任意のタイミングで完全停止とさせていただきます。 現在も当サービスのDNSサーバーをご利用されているお客様に置かれましては、サービスの完全終了までにご利用のドメインレジストラ様にて必要なお手続きを行っていただきますよう重ねてお願い申し上げます。 ※1 ns1.dzndns.com, ns2.dzndns.com, ns3.dzndns.com, ns4.dzndns.com 運営会社 : ウルカ株式会社

    Dozens(ダズンズ)| DNSサーバーのレンタル
  • Windows標準機能だけで、ディスクの残容量を監視する

    cles::blog 平常心是道 blogs: cles::blog NP_cles() « カールツァイスがマイクロフォーサーズに参加 :: 「ConnectBot」 Android向けのsshクライアント » 2011/02/08 Windows標準機能だけで、ディスクの残容量を監視する  windowsserver  systemmanagemant 1156 10へぇ これまで Windows Server の監視にはHealthMonitorを使っていたのですが、ちょっと動きが怪しかったりして、もうちょっといい方法がないかと調べてみたところ、 Windows の標準機能(いちおう2008以降という制限あるけど)だけで1日1回ディスク容量を調べて、一定以下になっていたらメールで通知が実現できることが分かったのでメモ。 流れとしては「タスク」の設定に「電子メールの送信」というものがあ

    Windows標準機能だけで、ディスクの残容量を監視する
  • [AWS][ELB]ELBがスケールアウトされないケース

    ELBがスケールアウトされず、Latency低下に悩んでた原因がハッキリしたのでメモ。 状況 アドサービスの入り口部分で、 フロントをさばいているELBのLatencyが、 ピークタイムに不自然な動き、Latencyが1sec超えるなどの遅延。 (何故かMAX3秒以上は遅延しない。) 対応 memcachedへのアクセスをinternal ELB経由で行なっていた部分を IP直指定とした。 Latencyは 10ms前後で落ち着いた。 このことから、遅延原因はinternal ELBと断定。 ELBの動作 SA様に聞いた所、 ELBは、内部的にEC2を動かして動作させてるとのことなのだが、 そのインスタンスが一定条件を満たした際に、ELBのスケールアウトが行われる。 (スケールアップも有るのかな?) スケールアウト条件は、対象インスタンスの CPU Utilization、Network

  • Chefに挫折したあなたへ。Fabricのすすめ

    サーバ設定作業は面倒で間違いを犯しやすいため、Chef/Puppetなどのツールで自動化したいと考えている方は多いと思います。 私もそのような理由からChef(-solo)を習得しようと試行錯誤していました。 その結果、ある程度は動くようになったものの次のような問題があると思いました。 学習に時間がかかる 私は正直、今でもどのファイルに何を書くのかよく分かってないです。 幾分か簡単だと言われるchef-soloでも公式サイトのドキュメントだけではよく理解出来ませんでした。 また、バージョンによる差異なのか目的が異なるのか分かりませんが、ブログ記事を参考にしようとすると十人十色でどれが私に合った手順なのかわかりませんでした。 例え最終的に理解できたとしても、私やあなたが何日もかけて理解できないことはチームのメンバーも理解するのは難しいと思います。 対象サーバにインストールする必要がある Ch

  • Chefを利用した運用省力化とDevOpsの取り組みについて

    2015/09/10 「Ansible 入門 #01 (初心者向け) 」の資料です。 ハンズオンの答え => https://github.com/uorat/ansible-handson.git https://atnd.org/events/68155

    Chefを利用した運用省力化とDevOpsの取り組みについて
  • csshXが素晴らしすぎる件

    人間とウェブの未来(旧) 「ウェブの歴史は人類の歴史の繰り返し」という観点から色々勉強しています。2014年までの人間とウェブの未来の旧ブログです。 複数のホストに対して、同時にコマンドを実行するツールはpssh等いくつかあると思うのですが、もっと自由度高く、viで編集したり、さらにはsshでログインしている状態でやれるような作業を全部同時にやりたいと思っていました。 そんな都合の良いツールはなかなかなくて、会社の人がLinuxでCluster SSHを使っていて、Linux限定かぁと諦めていたところ、なんとMacで使えるcluster SSHのcsshXがあるようだと教えてもらいました。これがあまりに素晴らし過ぎるので簡単に紹介します。 インストール brew環境を入れている人は以下のコマンド一発で使えるようになります。 [program lang=’bash’ escaped=’tru