eigo_sのブックマーク - はてなブックマーク

エンジニアのためのSRE論文への招待 - SRE NEXT 2023 - ゆううきブログ

この記事では、2023年9月29日に開催されたSRE NEXT 2023 IN TOKYOでの講演の概要に加えて、講演では触れられなかった部分の補足と、発表を終えての後記、最後にSRE NEXT全体の感想を書きました。 SRE NEXT 2020の基調講演に招いていただいたところから始まり、昨年のSRE NEXT 2022の公募セッションでも発表し、今回で3回目の発表になりました。今回の講演は、SRE NEXTの「NEXT」と価値観の一つである「Diversity」を踏まえて、自身のエンジニアと研究者の両方の経験を活かして、SREを深く実践する上で、技術論文を探して読むアプローチを提示するものです。昨今の国内のSREコミュニティでは組織的実践に主な関心が移っている状況と対比させて、コンピュータサイエンスに基づく技術的挑戦の可能性を示唆する意欲的な講演を目指したつもりです。この講演での主要

eigo_s 2023/10/03

sre
engineer

リンク

Linux eBPFトレーシング技術の概論とツール実装 - ゆううきブログ

eBPF（extended Berkley Packet Filter）という用語を著者が初めてみかけたのは、2015年ごろだった。最初は、eBPFをその字面のとおり、パケットキャプチャやパケットフィルタリングを担うだけの、Linuxの新しいサブシステムであろうと認識していた。しかし、実際にはそうではなかった。システム性能の分析のための方法論をまとめた書籍Systems Performance 1 の著者で有名なBrendan Greggが、Linuxのネットワークサブシステムとは特に関係ない文脈で、古典的なシステム性能計測ツールでは計測できないことを計測するツールを作っていた。その計測ツールがeBPFという技術によって実装されていることを知ったときに、eBPFに興味をもったのだった。また、eBPFは、システム性能を調べる用途以外にXDP（eXpress Data Path）と呼ばれるプ

eigo_s 2022/01/05

リンク

クラウド系の国際会議IEEE CLOUD 2020参加録 - ゆううきブログ

2020年の10月18日から24日までの5日間にわたって、国際会議IEEE World Congress on SERVICES 2020（IEEE SERVICES 2020）がオンライン形式で開催された。 IEEE SERVICESは、IEEE Computer Societyにより2004年から開催されている「サービスコンピューティング」全般に関連するトピックを扱う複数の国際会議が共催されるイベントとなっている。本来は、7月に北京開催されるはずだったが、COVID-19の感染拡大の影響により、10月に延期されたのちにオンライン開催される運びとなった。今回開催されたのは次の5つの国際会議、CLOUD/ICWS/SCC/SMDS/EDGEである。このうちCLOUD 2020を中心とした参加報告を次のスライドにまとめている。各発表を聴講したところ、多くの発表に共通してみられた特徴と

eigo_s 2021/10/13

リンク

サーバーレスアーキテクチャ再考 - ゆううきブログ

2014年にAWS Lambdaが登場し、Functionを単位としてアプリケーションを実行する基盤をFunction as a Service(以下、FaaS)と呼ぶようになった。そして、同時にサーバーレスアーキテクチャ、またはサーバーレスコンピューティングと呼ばれる新しいコンセプトが普及するに至った。当初、そのコンセプトが一体何を示すかが定まっていなかったために議論が巻き起こり、今現在では一定の理解に着地し、議論が落ち着いているようにみえる。しかし、サーバーレスという名付けが悪いということで議論が着地したようにみえていることにわずかに疑問を覚えたために、2019年の今、これらの流れを振り返ってみて、サーバーレスアーキテクチャとは何かを改めて考えてみる。サーバーレスとの個人的関わりサーバーレスアーキテクチャという名を僕がはじめて耳にしたのはAWS Lambdaが登場した2015

eigo_s 2019/09/12

リンク

2019年SRE考 - ゆううきブログ

この記事では、自分が数年Site Reliability Engineering (SRE)を実践しつつ、SREについて考えてきたことをまとめる。先月開催されたMackerel Drink Up #8 Tokyoと先日開催された次世代Webカンファレンス 2019では、SREについて集中的に議論する機会に恵まれたため、脳内メモリにキャッシュされているうちに、SREに関する私的な論考をまとめておく。 (以降では、SRE本の原著にならい、技術領域名を指すときはSRE、職種名を指すときにSREsと表記する。) SREとの関わりなぜSREに関心をもったのか 2015年にメルカリさんがSREチームを発足したときに、SREsの存在を知り、SREsはシステム管理者、Webオペレーションエンジニア、インフラエンジニアといった既存の職種を置き換えていくものだと理解した。当時、自分が注目したのは、SRE

eigo_s 2019/01/17

sre

リンク

株式会社はてなを退職しました - ゆううきブログ

2018年12月21日の今日がはてなでの最終出社日となりました。はてなには、2013年12月に新卒として入社し、その後5年間に渡りお世話になりました。はてなとの出会いのきっかけは、2011年のはてなインターンに参加したことでした。はてなインターンの特徴の一つに、ほとんどの参加者が参加したときの内容をブログ記事として書いていることがあります。インターン参加記事には、技術やWebに対する大きな熱量がこもっており、すっかり自分もWeb技術をやっていくのだと感化されました。ダメ元で選考に望んだところ、運良く選考通過のお知らせをいただいてとてもうれしかったことを今もよく覚えています。そこから毎年インターンの参加者をみてきていますが、とてもハイレベルで、よく自分が選考通過したものだと今でも思います。この出来事が自身の人生にとって大きな転機だったと言えるでしょう。インターンの1年後にアルバ

eigo_s 2018/12/21

リンク

サーバレス時代におけるヘテロジニアス時系列データベースアーキテクチャ - ゆううきブログ

この記事は、第2回ウェブシステムアーキテクチャ研究会の予稿です。ウェブシステムをモニタリングするために、高可用性、高書き込みスケーラビリティ、メトリックの長期保存が可能な時系列データベースが求められている。これらを実現するために、性能特性の異なる汎用Key-Value Store(以下KVS)を組み合わせ、透過的に問い合わせ可能な、ヘテロジニアス時系列データベースであるDiamondを開発した。この記事では、Diamondを分散システムの観点で捉え、アーキテクチャ、データ構造、実装を紹介し、考察によりFuture Workを議論する。 1. はじめに 2. アーキテクチャアーキテクチャ概要動作フローデータ構造 KVSの機能要件 3. 実装実装概要 KVS間のデータ移動データ位置の解決費用特性 4. 考察と今後の課題 Diamondの欠点将来機能 5. まとめスライド

eigo_s 2018/05/18

リンク

DynamoDBのインフラコスト構造と削減策 - ゆううきブログ

Amazon DynamoDBは、RDSのようなインスタンスサイズによる課金モデルではなく、ストレージのデータ使用量とスループットを基にした課金モデルになっている。インスタンスサイズによる課金モデルでないデータストア系サービスとして、他にはS3、Kinesisなどがある。これらは、AWSの中でも、フルマネージドサービスと呼ばれる位置づけとなるサービスだ。フルマネージドサービスは、ElastiCacheのようなそうでないものと比較し、AWSに最適化されていて、サービスとしてよくできていると感じている。 Mackerelの時系列データベースのスタックの一つとして、DynamoDBを採用している。時系列データベースの開発は、コストとの戦いだったために、それなりにコスト知見が蓄積してきた。(時系列データベースという概念をクラウドの技で再構築する - ゆううきブログ) (※ 以下は、2018

eigo_s 2018/04/18

aws
dynamodb

リンク

AnsibleとDockerによる1000台同時SSHオペレーション環境 - ゆううきブログ

1000台同時SSHオペレーション環境を構築するにあたって、手元のローカル環境の性能限界の問題を解決するために、オペレーションサーバをSSHクライアントとすることによりSSH実行を高速化した。実行環境としてDocker、レジストリとしてAmazon ECR(EC2 Container Registry)を用いて、ローカル環境とオペレーションサーバ環境を統一することにより、オペレーションサーバの構成管理の手間を削減した。はじめにシステム構成実装上の工夫オペレーションサーバ越しのroot権限実行 rawモジュールとscriptモジュールのみの利用 Ansibleの実行ログのGit保存まとめと今後の課題はじめに 3年前に Ansible + Mackerel APIによる1000台規模のサーバオペレーション - ゆううきブログという記事を書いた。この記事では、ホストインベントリと

eigo_s 2018/01/29

リンク

RedisサーバのCPU負荷対策パターン - ゆううきブログ

Redisは多彩なデータ構造をもつ1インメモリDBであり、昨今のWebアプリケーションのデータストアの一つとして、広く利用されている。しかし、一方で、性能改善のための手法を体系的にまとめた資料が見当たらないと感じていた。実際、最初にCPU負荷が問題になったときにどうしたものかと悩み、調査と試行錯誤を繰り返した。そこで、この記事では、自分の経験を基に、RedisサーバのCPU負荷対策を「CPU負荷削減」「スケールアップ」「スケールアウト」に分類し、パターンとしてまとめる。背景 RedisのCPU負荷対策パターン CPU負荷削減 multiコマンド Redisパイプライニング Luaスクリプティング Redisモジュール(夢) スケールアップスケールアウト参照用スレーブ垂直分割水平分割 Redis Clusterによる水平分割その他スライド資料あとがき参考資料背景 R

eigo_s 2017/09/18

リンク

時系列データベースという概念をクラウドの技で再構築する - ゆううきブログ

サーバ監視サービスMackerelにおいて開発中の、高解像度・長期間のサーバメトリック収集を実現するための新しい時系列データベースDiamondを紹介します。具体的には、Amazon ElastiCache、Amazon DynamoDB、Amazon S3を組み合わせ、Amazon Kinesis StreamsとAWS Lambdaによりコンポーネント間を接続した、階層構造のデータストアアーキテクチャの設計と実装を解説します。 2018/06/05 追記: この記事の内容をWSA研#2でより一般的なアーキテクチャレベルでの貢献として書き直しました。サーバレス時代におけるヘテロジニアス時系列データベースアーキテクチャ - ゆううきブログはじめに先日開催されたAWS Summit Tokyo 2017にて、「時系列データベースという概念をクラウドの技で再構築する」というタイトルで登壇

eigo_s 2017/06/08

おもしろい

リンク

高度に発達したシステムの異常は神の怒りと見分けがつかない - IPSJ-ONE2017 - ゆううきブログ

名古屋大学で開催されたIPSJ-ONE2017 で登壇しました。 IPSJ-ONEというのは、情報処理学会の各研究会から選ばれた日本の若手トップ研究者17人が集まり、自身の研究を高校生でもわかるように発表するイベントです。 1000人ぐらい入る講堂で、しかもニコニコ生放送で配信されるというとても大掛かりなイベントです。ちなみに、昨年は、同じ研究会からの推薦で、 id:matsumoto_r (matsumotory) さんが登壇されています。 IPSJ-ONE 2016で登壇してきた - 確実に時代は変わってきている #ipsjone - 人間とウェブの未来発表「高度に発達したシステムの異常は神の怒りと見分けがつかない」という、一見何の話かわからないやばそうな話なんですが、大真面目に話してきました。スライドを以下に公開しています。ただ、スライドだと何の話をしているかおそらくわからな

eigo_s 2017/03/22

monitoring

リンク

ISUCON予選突破を支えたオペレーション技術 - ゆううきブログ

ISUCONに参加する会社の同僚を応援するために、ISUCONの予選突破する上で必要なオペレーション技術を紹介します。自分がISUCONに初出場したときに知りたかったことを意識して書いてみました。一応、過去2回予選突破した経験があるので、それなりには参考になると思います。といっても、中身は至って標準的な内容です。特に、チームにオペレーションエンジニアがいない場合、役に立つと思います。今年のISUCON6は開催間近で、まだ予選登録受付中です。 ※ 文中の設定ファイルなどはバージョンやその他の環境が異なると動かなかったりするので必ず検証してから使用してください。 ISUCONでやること (Goal) ISUCONでやることは、与えられたウェブアプリケーションをとにかく高速化することだけです。高速化と一口に言っても、複数のゴールがあります。ウェブアプリケーションの場合は以下のようなも

eigo_s 2016/08/23

performance

リンク

Googleが数千台もある10年前のLinuxディストリをライブアップグレードした話 - ゆううきブログ

Googleが、太古のディストリビューションであるRed Hat 7.1から、10年新しいDebianベースのディストリビューションへ、ライブアップグレードした話を紹介する。そのあと、自分の身の回りの環境と比較し、参考にすべきポイントを考察する。原文は USENIX LISA の投稿論文だ。しかし、中身は論文体というよりは、事例の紹介といった適切かもしれない。 MERLIN, M. Live Upgrading Thousands of Servers from an Ancient Red Hat Distribution to 10 Year Newer Debian Based One. In Proceedings of the 27th conference on Large Installation System Administration (LISA) (2013),

eigo_s 2016/05/31

Google

リンク

自作Linuxコンテナの時代 - ゆううきブログ

最近、Docker以外のコンテナ型仮想化技術の流れとして、自作コンテナエンジンの時代が来るのではないかと感じている。自作コンテナエンジンとは、コンテナ型仮想化技術を構成する個々の要素技術を組み合わせ、自分の用途にあわせて最適化したコンテナエンジンのことだ。他のOSのコンテナ仮想化技術について疎いため、以下ではLinuxに限定して話を進める。概要 Dockerも含めて、Linuxコンテナはコンテナを構成する複数の要素技術の組み合わせである。自分のやりたいことに対して、Dockerをはじめ既存のコンテナエンジンが複雑すぎるケースがある。そこで、自分の用途にあわせてコンテナエンジンを自作することを考えてみる。libcontainerに代表されるように、Linuxコンテナエンジンを自作しやすい環境が整いつつある。今後は、巨大なコンテナエンジンに対して、UNIX哲学に基づいて制御可能な小さなコ

eigo_s 2016/04/29

リンク

ウェブアプリケーション開発に新言語を採用したときにインフラで考えたこと - ゆううきブログ

この文章は、サーバサイドのウェブアプリケーション開発において、社内実績の少ない新しい言語を採用したときにインフラ面で考慮したことを社内向けにまとめたものです。はてなでは、長らくPerlでウェブアプリケーション開発を続けてきた一方、ここ数年で社内でScalaまたはGoの採用事例も増えてきました。今後開発が始まるプロダクトにおいても、Perl、Scala、Goもしくは他の言語を採用するかどうかを開発開始時に選ぶことになるでしょう。新言語を採用するときに、考慮すべきことの一つとして、「インフラ」への影響があります。新言語に関する雑談をしていると、ウェブアプリケーションエンジニアに「インフラ」への影響について聞かれます。もしくは、ウェブオペレーションエンジニアから考慮するポイントを伝えることもあります。 ScalaやGo以外に、Node.jsやサーバサイドSwiftはどうかというのも雑談

eigo_s 2016/03/03

リンク

2015年の心に残った技術エントリ - ゆううきブログ

１年分の自分のはてなブックマークを見直した。およそ 2,000 URLのエントリの中から、特に感銘を受けたり、記憶に残ったエントリを紹介したい。 2015年にブクマしたというだけで、必ずしも2016年に公開されたエントリばかりではないことに注意。エントリ Scala ble Deployments Advanced Techinic for OS upgradeing in 3 minutes MySQLやSSDとかの話モバイルアプリのスレッドプールサイズの最適化性能測定道情報科学における18のメタテクニック Webオペレーションエンジニアのアウトプットと開発力はてなに入った技術者の皆さんへシンプルでかつ最高のJavaScriptプロファイラ sjsp を作りました！ペパボのインターネット基盤技術研究・開発の活動インフラチーム改め Site Reliability Engi

eigo_s 2016/01/05

リンク

Dockerとchrootを組み合わせたシンプルなコンテナデプロイツール - ゆううきブログ

この記事ははてなエンジニアアドベントカレンダー2015の1日目です。今回は、既存の運用フローに乗せやすいDockerイメージへのchrootによるデプロイの考え方と自作のコンセプトツール droot を紹介します。 github.com 背景 Docker 本番導入の課題 Docker 導入の目的 Docker + chroot のアイデア droot: Dockerイメージにchrootするコンテナツール droot の使い方 droot push: Dockerイメージをtar ball化しS3にpushする droot pull: S3にpushしたイメージをダウンロードし展開する droot run: 展開先のディレクトリにchrootする droot の実装 droot push/pull の実装 droot run の実装あわせて読みたいあとがき背景 Dockerがリリー

eigo_s 2015/12/02

リンク

なにもわからないところから始めるJVMモニタリング #jvmcasual - ゆううきブログ

JVM Operation Casual Talks で発表してきた。なんでJVMでしゃべってたのか本当によくわからない。 JVM Operation Casual Talks : ATND とにかく雑な発表したという記憶しかない。 NewRelic のトップページにでかでかとおっさんでてきて印象悪いとかそういうの。 JVM とかどうでもよくて mackerel: 新しいアプリケーションパフォーマンスマネジメントにしか興味がなかった。 Java Performance (Java Series) 作者: Charlie Hunt,Binu John出版社/メーカー: Addison-Wesley Professional発売日: 2011/10/04メディア: Kindle版この商品を含むブログを見る Java Performance: The Definitive Guide 作者:

eigo_s 2015/09/29

JVM
java

リンク

はてなで大規模サービスのインフラを学んだ - ゆううきブログ

中〜大規模サービスのインフラの様子を知りたいアプリケーションエンジニア向けに、もともとアプリケーションコードを書いていた視点から、個人的な体験をベースにはてなで大規模サービスのインフラを学んだ過程や学んだ内容の一部を紹介します。 Webアプリケーションのブラックボックス Webアプリケーションフレームワークの向こう側なぜ複数のサーバが必要なのか突然のWebサービス3層構成リバースプロキシアプリケーションデータベースその他のコンポーネントキャッシュは麻薬飛び道具としてのKVS/NoSQL 非同期処理バッチ処理 Mackerelの場合参考まとめ Webアプリケーションのブラックボックス今年もはてなインターンの時期が近づいてきた。毎年ではないけど、はてなインターンでは「インフラ講義」というのをやっている。今年はインフラ講義の講師としてアサインされたのでちょうど何を話そ

eigo_s 2015/08/01

リンク

はてなブックマーク

タグ

ブックマーク / blog.yuuk.io (35)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス