sheeploghのブックマーク - はてなブックマーク

Prometheusによる数百台規模のモニタリングで直面した問題について | GREE Engineering

インフラの反田 (@mtanda) です。 GREEでは、多くのサービスをAWS環境で運用しており、それらサービスのモニタリングシステムとしてPrometheusを利用しています。 Prometheusを導入してから約2年がたち、1台のPrometheusで数百台規模のインスタンスをモニタリングするなかで、さまざまな問題に直面しました。それら問題の原因を分析し、設定や利用の仕方を改善することで、ある程度安定して運用できるようになりました。これらの知見が少しでもお役に立てばと思い、ここで共有いたします。なお、対象とするPrometheusのバージョンは1.xです。Prometheus 2.0では、これら問題のほぼ全てに対して改善されています。そのため、2.0でどういった点が改善されているかを知るためにも有用だと思います。 Prometheusのストレージ実装の基礎知識 Promethe

sheeplogh 2017/10/24

リンク

泥臭いサーバ運用自動化の話 | GREE Engineering

こんにちは、North America事業本部のLiang Fanです。このエントリーは GREE Advent Calendar 2015 10日目の記事です。本日は、以前所属していたインフラストラクチャ部のサーバ運用と自動化の話を少しご紹介したいと思います。よろしくお願い致します。はじめに運用自動化と聞いて、みなさんは頭の中に何を浮かべますか？仮想化技術(docker、VM)、構成管理ツール(chef、puppet)やクラウドサービス(AWS、Google Cloud Platform）などの答えがたくさん出てくるかもしれません。本日はそれらの技術を使って、かっこいい運用自動化ができたという話ではなく、レガシー環境のサーバ運用を少しでも楽にするための泥臭い自動化の話を紹介したいと思います。グリーのレガシー環境レガシー環境と言っても、もう歩けない80歳のおじいさんではなく、

sheeplogh 2015/12/10

リンク

Linux TC (帯域制御、帯域保証) 設定ガイドライン | GREE Engineering

Abstract このドキュメントはLinuxにおいて帯域制限のためにtcを用いる際のガイドラインです。 tcは様々な用途に活用できるものですが、プロダクションにおいて特定のserver daemonのトラフィックを制限するというシナリオで活用することを目的としています。 tcのより詳しい詳細については別にドキュメントを書きましたのでそちらを参照してください。よくわかるLinux帯域制限 Root qdiscの選定帯域制限を行いたい場合のqdiscは主に以下のようになるでしょう。 TBF PRIO + 内部qdiscとしてTBF HTB それぞれ用途に合わせて適切なものがあるのですが、機能としてはHTBが前者2つの上位互換となるので、迷った場合にはHTBを使えば問題ありません。ということで以後HTBの設定について解説します。 class構造,トラフィックのclassify, filte

sheeplogh 2015/07/04

リンク

男性エンジニアリングマネージャが長期育休を取った話 | GREE Engineering

こんにちは、Data Engineering Groupマネージャのmoritaです。このエントリはGREE Advent Calendar 2014 9日目の記事になります。今日は、今年前半に半年間の育児休業を頂いたので、そこで感じた事を書こうと思います。会社に育休制度はあるし家族も育休取得に好意的、だけど周囲の眼や復帰後のキャリアが気になる、という方の背中を少しでも押すことができればいいなと思っています。エンジニアブログなので、エンジニアの視点から見た育休、特に育休とエンジニアキャリア/エンジニア組織の関係性についても書ければと思います。育児休業のあらましまず始めに育児休業の概要を説明します。育児休業は育児・介護休業法により定められています。法律により、従業員は労使協定で定められた条件（典型的には勤続１年以上という条件が付くようです）を満たす場合に育児休業を取得できることに

sheeplogh 2014/12/09

リンク

よくわかるLinux帯域制限 | GREE Engineering

矢口です。みなさんはLinuxのtcという機能をご存知でしょうか。送信するパケットの帯域制御を行うことができる大変強力な機能で、グリーでもいくつかの用途で使用されています。具体的な事例の一つはRedisです。Redisではreplicationを新規に開始する際やfailoverが発生しmasterが切り替わった際(特に2.6系)にストアされている全データが転送されます。しかし帯域制限をかける機能がないため、ネットワーク帯域を圧迫してしまう危険性があります。また通常のクライアントとの通信でも大量のクエリにより予想以上の帯域を使用してしまう可能性があります。このような場合にtcを用いることでRedisの使用する帯域をコントロールできます。このように有用なtcですが残念なことに日本語/英語ともにわかりやすい解説や詳細な情報は多くありません。私も社内において使われていたtcの設定に問題が

sheeplogh 2014/10/08

リンク

グリーのインフラに Chef を導入した話 | GREE Engineering

類似のソフトウェアとして、Puppet や Ansible といったものもあります。こういったインフラ自動化まわりのソフトウェアについてはペパボの宮下さんのインフラ系技術の流れが参考になります。 Chef in グリーさて、グリーでのChefまわりの構成をご紹介します。下図が全体の構成です。開発環境開発は各個人のマシン上で仮想マシンを立ち上げて行なっています。クックブックの開発では、クックブックを開発する人が serverspec でテストを書くようにしていて、構築後のサーバが期待通り動くことをテストしています。一つのクックブックでも設定値などの条件によって動作が変わってくるため、test-kitchen を用いて複数の条件（ランリストやノードのアトリビュート（以下、「アトリビュート」）などの組み合わせ）でテストを行っています。また、一部仮想マシンを使う必要がないテスト（att

sheeplogh 2013/12/26

リンク

CTOとはなんなのか、あるいはエンジニアの生存戦略 | GREE Engineering

Merry Christmas! GREE Advent Calendar もいよいよ最終日、25日目はグリー株式会社でCTOをしておりますふじもとがお送りします。今日まで24人のGREE Engineersなみなさまにエントリを書いていただいたわけですが、思ったよりも多種多様な内容で、あらためていろいろな方面で素敵なエンジニアがいるなー、としみじみしてしまいました。いやしかしgitとchefの記事人気ですね、そして、「当然CTOはすごい記事書くんですよね」とプレッシャーをかけて楽しむ仲間たちに囲まれてぼくは幸せです、あーすごい幸せー。そんなプレッシャーの中、今までのエントリとはちょっと方向性を変えて、CTOの話でも書いてみようかと思います。なお、ぼくの趣味は多分問題解決です。そんなわたくしふじもとは来年で、CTOっていう肩書きでお仕事をはじめて10年とかになるんですが、なかなか先輩と

sheeplogh 2013/12/25

リンク

git による分散作業パターン | GREE Engineering

分散バージョン管理を華麗に扱いたい堀口です。 GREE Advent calendar 2013 の 14 日目として参加させていただきます。お二人に続き Haskell の話をしようかと思ったのですが、急遽無難な開発の話に変更しました :o Java や C++ には OOP の概念が必要であったように、分散作業の認識が薄いまま git や Mercurial を使うことは長期的に不幸をもたらします。とあるプロジェクトにて、その一部を副産物のミドルウェアとして抽出すべく、アプリケーションと分離したい不具合があったので原因を探りたいが、依存関係が複雑すぎるのでコードを読む量を減らしたいテストやレビュー、提案、リファクタの運用を強化したいよそのプロジェクトに迷惑を掛けないように、そこのツールを改良して使いたい。いままで何気なく「こんなもんだろう」と思って手間をかけていませんでした

sheeplogh 2013/12/17

Git

リンク

クライアントサイドJavaScriptのライセンス管理 | GREE Engineering

最近シリコンウエハーもらって嬉しかったago（@kyo_ago）です。このエントリはGREE Advent Calendar 2013 11日目の記事です。今回はクライアントサイドJavaScriptにおけるライセンス管理の問題を取り上げたいと思います。ライセンス管理の問題点「使用しているライブラリのライセンス管理をどうするか」はクライアントサイドJavaScriptにかぎらず発生する問題ですが、クライアントサイドJavaScriptには以下の様な特徴があるため問題が複雑になります。コードが結合、圧縮される場合があるクライアントサイドJavaScriptでは読み込みの速度を上げるため、使用しているライブラリの結合、圧縮を行うことがあります。しかし、この時誤ってライセンス文が捨てられてしまうことがあります。ソースが外部に公開されるクライアントサイドJavaScriptではソー

sheeplogh 2013/12/11

リンク

はてなブックマーク

タグ

ブックマーク / labs.gree.jp (9)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第5週）

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス