並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 1959件

新着順 人気順

EKSの検索結果361 - 400 件 / 1959件

  • 最もリスクの高いAWS構成トップ3 #aqua #コンテナ #セキュリティ - クリエーションライン株式会社

    本ブログは「Aqua Security」社の技術ブログで2021年1月20日に公開された「 The 3 Riskiest Cloud Native AWS Configurations 」の日本語翻訳です。 EC2 だけでも数十もの主要なセキュリティ設定が可能なため、AWS の設定オプションの多さに圧倒されることがあります。複雑さが増す一方で、クラウドネイティブデプロイメントにおいて動的なインフラ要件に対応するには、クラウドアカウントを適切に、そして安全に設定することが重要です。サービスを適切に設定するという課題は、利用可能な AWS サービスの数が膨大であり、それぞれが独自の要件を持っているため、さらに複雑になっています。 AWS のクラウドサービスは、新しいサービスの提供や定期的なアップデートなどで常に変動し、CSPM(Cloud Security Posture Management

      最もリスクの高いAWS構成トップ3 #aqua #コンテナ #セキュリティ - クリエーションライン株式会社
    • WEARにおけるプッシュ通知システムのリプレイスを全て完了した話 - ZOZO TECH BLOG

      こんにちは、WEARバックエンドブロックの天春です。バックエンドの運用・開発に携わっています。本記事では、以前公開したWEARにおけるプッシュ通知システムのリプレイス のフェーズ2を終え、旧環境のプッシュ通知システムのリプレイスを完了したのでシステム構成や移行手順をご紹介します。 目次 目次 1:Nのプッシュ通知システム リプレイス前の1:Nのプッシュ通知システム リプレイス前のシステム構成 問題点 リプレイス後の1:Nのプッシュ通知システム リプレイス後のシステム構成 1:Nキュー(Sidekiqダッシュボード) 負荷テスト 目標 対象 事前準備 負荷テスト実施 負荷テスト結果 負荷テスト実施後の改善内容 大量の通知の遅延を減らす 同時実行数の調整 500件単位でFCM通知配信 1:N通知配信の親ジョブ 500件単位でFCM配信を行う1:N通知配信の子ジョブ 500件単位でDynamoD

        WEARにおけるプッシュ通知システムのリプレイスを全て完了した話 - ZOZO TECH BLOG
      • [AWS Black Belt Online Seminar] CON246 ログ入門 資料公開 | Amazon Web Services

        Amazon Web Services ブログ [AWS Black Belt Online Seminar] CON246 ログ入門 資料公開 AWS Black Belt オンラインセミナー「CON246 ログ入門」を公開します。 視聴は YouTube から、資料閲覧は SlideShare から可能です。 このセッションでは、コンテナを利用する上で必要となるログの取り扱いについて、ログの目的に応じたAWS各種サービスとのインテグレーション方法、Amazon ECS, Amazon EKS 環境からどのようにログを取得するのか、その取得方法についてご紹介します。 セッションは9分ほどの長さになります。 本資料や動画を通じて、より一層みなさまのコンテナワークロードが進むことを楽しみにしております。 今回の YouTube は AWS Black Belt オンライン AWS コンテナサ

          [AWS Black Belt Online Seminar] CON246 ログ入門 資料公開 | Amazon Web Services
        • TiDB on AWS EKS 〜DMM動画のPoCレポート〜 - DMM inside

          |DMM inside

            TiDB on AWS EKS 〜DMM動画のPoCレポート〜 - DMM inside
          • モンスターストライク スタジアムをAmazon EC2からAmazon ECS Fargateに移行しました

            MIXI でモンストサーバチームとセキュリティ室を兼務している、atponsです。 モンストサーバチームでは、モンスターストライクとは別に、モンスターストライク スタジアムというスマートフォンのアプリゲームのサーバ開発・運用を行っています。 モンスターストライク スタジアムは、モンスターストライクとプレイスタイルは同じながら、4vs4の最大8人まで同時対戦や練習モードなどを備えたアプリになっており、モンストのeスポーツ大会「モンストグランプリ」を開催する際にも利用されています。 開発体制の現状 モンスターストライク スタジアムは、初期の段階でモンスターストライクのコードから分岐する形で開発されているため、アップストリームの変更を順次取り込んでいくという仕組みで運用されています。そのため、サーバコードなどは別にあり、適宜新機能を取り込んでいきアップストリームと合わせていくという開発・運用フロ

              モンスターストライク スタジアムをAmazon EC2からAmazon ECS Fargateに移行しました
            • ABEJA Insight for Retailの技術スタックを公開します (2021年10月版) - ABEJA Tech Blog

              初めに 会社・事業紹介 ABEJA Insight for Retailについて 技術スタック 全体アーキテクチャ図 ① 映像録画・解析システム ②データ基盤部分 ③ Webダッシュボード その他 (全体共通部分) 一緒に働く仲間を募集中! 最後に 初めに こんにちわ。大田黒(おおたぐろ)です。暑い日が落ち着いてきて、秋(冬?)が来たなぁと感じるこの頃です。皆様いかがおすごしでしょうか。前回の「ABEJAの技術スタックを公開します (2019年11月版)」が公開されてからしばらく経ちました。 引き続きエンジニアの方とお話させていただく中で、 「ABEJAってよく聞くけど...実際どんなことやってるのかよくわからない」 「AIのお硬いSIerって感じなんでしょ?」 「社内は機械学習エンジニアばっかりなんでしょ...??」 といったご質問をいただくことが多いです。 今回の記事では、最新の会社や

                ABEJA Insight for Retailの技術スタックを公開します (2021年10月版) - ABEJA Tech Blog
              • [速報]「Amazon DevOps Guru」発表。DevOps関連の設定ミスやコードの問題などを機械学習が指摘してくれる。AWS re:Invent 2020

                Amazon Web Services(AWS)は、オンラインで開催中の年次イベント「AWS re:Invent 2020」で、DevOpsの実現を支援するマネージドサービス「Amazon DevOps Guru」を発表しました。 一般に、DevOpsの実現には、分散環境を活用しつつコードの編集、ビルド、テスト、デプロイなどの一連のツールを連係させ、本番環境でのログを収集し分析するなど、手間のかかる運用が求められます。 Amazon DevOps Guruは、AWSにおけるDevOpsの経験を元に行った機械学習により、DevOpsのサイクルの中で発生する構成ミスやリソース不足が予想される際の警告、問題が発生しそうなコードや構成に対する変更の発見、データベースのI/O性能不足に対する警告などを行ってくれるサービス。 これにより複雑で手間のかかるDevOpsの実現と運用を支援してくれるというも

                  [速報]「Amazon DevOps Guru」発表。DevOps関連の設定ミスやコードの問題などを機械学習が指摘してくれる。AWS re:Invent 2020
                • 〜運用しやすいプレビュー環境を求めて〜 Gateway APIで作るサービスメッシュレスなプレビュー環境 - LIVESENSE ENGINEER BLOG

                  みなさん、プレビュー環境してますか?どうも、かたいなかです。 以前、記事や登壇でIstioベースのPreview環境の構築方法をご紹介しました。 made.livesense.co.jp 外向けに発表したものの、Istioの運用工数や学習コストがネックとなってしまい、実際の転職会議の開発環境の導入にはいたっていませんでした。 最近になってGateway APIの実装例も増えてきて、Istio以外にもプレビュー環境でのヘッダを元にしたルーティングの実現において、現実的な選択肢となりそうなツールが増えてきました。そこで、Gateway APIのEnvoyによる実装であるEnvoy Gatewayを用いて、サービスメッシュを使用しないプレビュー環境の構築を試してみたため、この記事では構成例をご紹介します。 なお、今回の記事の中ではプレビュー環境の説明等について前回の記事と同様の説明を再度する箇所

                    〜運用しやすいプレビュー環境を求めて〜 Gateway APIで作るサービスメッシュレスなプレビュー環境 - LIVESENSE ENGINEER BLOG
                  • 詳解 Terraform 第3版

                    TOPICS System/Network 発行年月日 2023年11月21日 発売予定 PRINT LENGTH 472 (予定) ISBN 978-4-8144-0052-2 原書 Terraform: Up & Running, 3rd Edition FORMAT Print PDF EPUB 本書は、Terraformのシンプルな宣言的表現によって、コマンド操作で、インフラをデプロイし管理する方法を豊富なサンプルコードを使って解説します。 Terraformがインフラの状態をどのように管理し、ファイルのレイアウト、分離、ロックにどのように影響するかを学びます。またTerraformを使ったサーバクラスタやロードバランサ、データベースのデプロイ、Terraformモジュールでの再利用可能なインフラの作成、ゼロダウンタイムデプロイを実現するための高度なTerraformの文法を解説し

                      詳解 Terraform 第3版
                    • 4年以上待ってたEKSの改善がようやく出てきた件 - inductor's blog

                      はじめに これは、Kubernetesアドベントカレンダー2の20日目の記事です。 これの話です。 aws.amazon.com ただし俺はもうEKS全然使ってないから意味ない件😢 なんの話? 待ってたとは 4年前に、AWSでコンテナ使ってる人ならお馴染みのaws/containers-roadmapにこんなIssue(もとい、Feature Request)を作りました。 github.com また、これに関連するIssueとしてはその半年ほど前に作られていて github.com 自分としてはこのIssueを立てる前から技術選定の時点でずっと悩んでいたポイントだったので、かれこれ5年近く待っていたことになります。ようやくリリースされて本当によかった。まあ今はいらないんだけど、、、 どんな内容か これまでのEKSの課題点 EKSでクラスター管理者や運用者を指定する上で欠かせないのが、K

                        4年以上待ってたEKSの改善がようやく出てきた件 - inductor's blog
                      • Justin Garrison's Homepage

                        Hi, I'm Justin. I’m a developer who’s helped create Oscar winning movies at Disney Animation, built infrastructure for Disney+, and worked on EKS at AWS. I’m now the Director of Developer Relations at Sidero Labs and host of the Ship it! podcast

                          Justin Garrison's Homepage
                        • 入門 EKS on Fargate - Qiita

                          プロダクションで EKS on Fargate を(できるだけ)使うことを目標に EKS on Fargate に入門します。 Managed Node Groupとの使い分けなどについてもまとめます。 ※ 本記事は 2019/12/14 時点の情報に基づいています。 Fargate、EKS on Fargateとは FargateはAWS上で「仮想マシンの管理なしにコンテナをデプロイできるサービス」です。 元々はAWS独自のコンテナオーケストレーションシステムであるECSの一機能と思われていましたが、EKS on Fargateが登場した今では、「ECS・EKSどちらでも動く、コンテナ化されたワークロード向けのサーバレスコンピュートエンジン」という体でブランディングされているようです。Fargateの公式ページ冒頭でも以下のように紹介されています。 AWS Fargate is a se

                            入門 EKS on Fargate - Qiita
                          • 【総まとめ】GuardDutyによるコンテナランタイム脅威検知の注意事項と設定手順と検出の様子 #AWSreInvent | DevelopersIO

                            AWSマネージドサービスGuardDutyによる待望のコンテナランタイム脅威検知。その検知内容と設定上の注意事項、検出の様子をまとめてお届けします。 「ECSのランタイム脅威検知って、商用製品必須だよね。どれにすっかなぁ。結構高いよね」 「1年前の予告を経て、よーーーやくAWSマネージドなやつがGAされましたよ」 去年のre:Invent2022においてKeynote中に予告だけされていたコンテナ環境のランタイム検知(【速報】GuardDutyによるコンテナランタイムの脅威検知サービスが発表されました!)。 先日のre:Invent 2023のアップデートにより、待望のECSにおけるランタイム検知が、GuardDutyで実現できるようになりました!!もともとEKSにおけるランタイム検知は提供されていましたが、それがECSにも拡張されたアップデートです。 これまでAWSのECSにおいてランタ

                              【総まとめ】GuardDutyによるコンテナランタイム脅威検知の注意事項と設定手順と検出の様子 #AWSreInvent | DevelopersIO
                            • 2020年8月くらいのAWS最新情報ブログとかをキャッチアップする – AWSトレンドチェック勉強会用資料 | DevelopersIO

                              こんにちは、臼田です。 みなさん、AWSの最新情報はキャッチアップできていますか?(挨拶 社内で行っているAWSトレンドチェック勉強会の資料をブログにしました。 AWSトレンドチェック勉強会とは、「日々たくさん出るAWSの最新情報とかをブログでキャッチアップして、みんなでトレンディになろう」をテーマに実施している社内勉強会です。 このブログサイトであるDevelopers.IOには日々ありとあらゆるブログが投稿されますが、その中でもAWSのアップデートを中心に私の独断と偏見で面白いと思ったもの(あと自分のブログの宣伝)をピックアップして、だいたい月1で簡単に紹介しています。 もともと社内用のものなので、ゆるゆると眺めてください。なおいっぱいあります。最近はAWSのアップデート以外もいっぱい拾っています。 ちなみにAWSの最新情報をキャッチアップするだけなら週間AWSがおすすめですが、Dev

                                2020年8月くらいのAWS最新情報ブログとかをキャッチアップする – AWSトレンドチェック勉強会用資料 | DevelopersIO
                              • Istio Rate Limitを活用した流量制限の取り組み - ZOZO TECH BLOG

                                はじめに こんにちは、ECプラットフォーム基盤SREブロックの織田と、カート決済SREブロックの遠藤です。 本記事では、Istio Rate Limitの概要とZOZOTOWNでの導入事例を2つご紹介します。 目次 はじめに 目次 現在のZOZOTOWN Istio Rate Limitの概要 Istio Rate Limitとは? 仕組み どのような制限ができるのか? Circuit Breakerとの違い 導入事例 事例1. マイクロサービスから外部APIへのリクエスト制限 構成 設定と計測のポイント 1. レイテンシの計測 2. 1つのAPIに対して2重の制限を設定 事例2. オンプレミス環境のリクエスト制限 構成 設定と計測のポイント 1. 商品別の注文リクエスト数制限 2. 閾値決定のための負荷試験 今後の展望 感想 最後に 現在のZOZOTOWN ZOZOTOWNではオンプレミ

                                  Istio Rate Limitを活用した流量制限の取り組み - ZOZO TECH BLOG
                                • アジャイルなSREチームの運用

                                  LAPRAS株式会社でSREをしているyktakaha4と申します🐧 弊社のSREチームで最近運用をはじめた見積もりやふりかえりの手法について書きたいと思います 大規模な立ち上がり済みの組織向けでなく、今ひとりで仕事をしている人が2人目のSREを迎え入れたときの一事例としてご覧ください 経緯 弊社は2016年に創業して以来、ソフトウェアエンジニアとして入社した社員がアプリケーションからクラウドまでプロダクト全体を開発・運用するというスタイルが取られていましたが、 エンジニア組織の拡大に伴い、2021年頃からプロダクトの信頼性や可用性の向上を責務とする専任のSREを立ててシステムの改善をおこなってきました 以下は、弊社で導入しているホラクラシーに基づいて定義された Site Reliabilityサークル のロールの一覧です 原則として、ロールは誰であっても自由に負うことができるので、主務

                                    アジャイルなSREチームの運用
                                  • 2019年を振り返る(機械学習の世界に足を踏み入れた) - shnagaiの日記

                                    年末で、ちょうどアドベントカレンダーの枠があったので今年一年の活動を振り返っていこうと思う。 この記事はコネヒト Advent Calendar 2019 21日目の記事です。 2019年は結構自分の働き方が変わった一年でもあったので、下記2点を中心に書いていく。 機械学習の世界に足を踏み入れた アウトプット中心の活動ログ 機械学習の世界に足を踏み入れた 組織の大きな変化もあり、今年から業務として機械学習に取り組んでいる。(元々興味はあったのでチャレンジするいい機会に恵まれたというのが正直なところ) ここでは、機械学習関連のものだけに絞って時系列でどんなことをやっていたのかを振り返ろうと思う。 1〜3月 当時のCTOの @tatsushim がPythonによるはじめての機械学習 という本を執筆しており、そのレビュワーとしてこの本を通じて機械学習を学び始めた。 この本は、機械学習の初学者が

                                      2019年を振り返る(機械学習の世界に足を踏み入れた) - shnagaiの日記
                                    • コンテナ実行に特化したAWS製オープンソースOS「Bottlerocket」がGAになりました! | DevelopersIO

                                      衝撃の発表 (ハマコー氏談) から半年、いよいよ「Bottlerocket」が正式リリースとなりました。 みなさん、こんにちは! AWS事業本部の青柳@福岡オフィスです。 今年3月、AWSからコンテナ実行に特化したOS「Bottlerocket」が発表されました。 Announcing the General Availability of Bottlerocket, a new open source Linux-based operating system purpose-built to run containers 発表と同時にパブリックプレビューとして試すことができる状態でしたが、このたび正式版としてリリースされました! ※ なお、Bottlerocketは「EKS」および「ECS」のホストOSとして利用可能ですが、今回GAになったのはEKS向けの利用についてのみですので、ご注意

                                        コンテナ実行に特化したAWS製オープンソースOS「Bottlerocket」がGAになりました! | DevelopersIO
                                      • 2023 年 1 月の AWS Black Belt オンラインセミナー資料及び動画公開のご案内 | Amazon Web Services

                                        Amazon Web Services ブログ 2023 年 1 月の AWS Black Belt オンラインセミナー資料及び動画公開のご案内 2023 年 1 月に公開された AWS Black Belt オンラインセミナーの資料及び動画についてご案内させて頂きます。 動画はオンデマンドでご視聴いただけます。 また、過去の AWS Black Belt オンラインセミナーの資料及び動画は「AWS サービス別資料集」に一覧がございます。 YouTube の再生リストは「AWS Black Belt Online Seminar の Playlist」をご覧ください。 AWS Storage Gateway オンプレミスアプリケーションに、事実上無制限のクラウドストレージへのアクセスを提供するハイブリッドクラウドストレージサービスである AWS Storage Gateway について紹介

                                          2023 年 1 月の AWS Black Belt オンラインセミナー資料及び動画公開のご案内 | Amazon Web Services
                                        • オンプレミス用AWS「AWS Outposts」でAmazon RDSが利用可能に。MySQLとPostgreSQL対応

                                          オンプレミス用AWS「AWS Outposts」でAmazon RDSが利用可能に。MySQLとPostgreSQL対応 Amazon Web Services(AWS)は、AWSのクラウドインフラと同等のシステムをオンプレミスに持ち込める「AWS Outposts」で、Amazon RDSが利用可能になったと発表しました。 AWS Outpostsは、同社がクラウドの構築で培ってきた技術を基にハードウェアとソフトウェアを設計、開発し、24インチのラックにシステム一式を搭載したシステム。あたかも自社内にAWSリージョンを置いたようになり、パブリッククラウドと連係したハイブリッドクラウドを実現できます。 2019年12月に米ラスベガスで開催された年次イベント「AWS re:Invent 2019」にて正式リリースとなりました。 [速報]AWSをオンプレミスに持ち込める「AWS Outpost

                                            オンプレミス用AWS「AWS Outposts」でAmazon RDSが利用可能に。MySQLとPostgreSQL対応
                                          • 2021 年の SRE チームの活動について - Gunosy Tech Blog

                                            はじめに SRE 部の茂木です。 こちらの記事は Gunosy Advent Calendar 2021 - Adventar の 21 日目の記事となります。 前回の記事はサンドバーグさんの 改めてドライブレコーダーを作ってみた - Gunosy Tech Blog でした。 かなりマニアックな内容となっていましたね。 さて、2017 年頃から 「SRE」という単語が世の中に出回ってから、数多くの実践が各企業で行われてきました。ですがその業務内容を詳細に公表している企業はそう多くはありません。 私は Gunosy に来てから正式な SRE チームに所属することになりましたが、 常にSRE の定義とは、難しいものがあるなと日々感じています(各社によって責任範囲や求められることがかなり違うため) 。 そこで今回は、 2021 年の Gunosy のSRE チームがどのような活動をしてきたかを

                                              2021 年の SRE チームの活動について - Gunosy Tech Blog
                                            • SREエンジニアが目指すGKE共通デプロイ基盤の完成形 - ぐるなびをちょっと良くするエンジニアブログ

                                              こんにちは。開発部門 開発部 Data AI Strategyセクション データ基盤 Unitの小野です。 2020年8月に入社してから早3年。SREエンジニアとして、日々業務改善に励んでいます。 ここ一年ほど、DAOという組織改善プロジェクトを推進していく中で、Google Kubernetes Engine (GKE)を使ったGKE共通デプロイ基盤の整備も進めてきました。 ※ DAOについての詳細はSREエンジニアが組織改善プロジェクトを立ち上げてみたを参照ください SREエンジニアの責務の一つは、プロダクトのリリースサイクルを極限まで短くし、次々と新しいサービスを世の中にリリースすることです。ChatGPTのような誰でも簡単に扱えるAIモデルが誕生したことで、プロダクト開発競争は今後ますます激しくなっていくと予想しており、SREエンジニアの責務の重要性をヒシヒシと感じています。 そう

                                                SREエンジニアが目指すGKE共通デプロイ基盤の完成形 - ぐるなびをちょっと良くするエンジニアブログ
                                              • 5GキャリアのエッジロケーションにAWSを設置、モバイルデバイスから利用できる「AWS Wavelength」発表。国内ではKDDIが提携。AWS re:Invent 2019

                                                5GキャリアのエッジロケーションにAWSを設置、モバイルデバイスから利用できる「AWS Wavelength」発表。国内ではKDDIが提携。AWS re:Invent 2019 AWSは米ラスベガスで開催中の年次イベント「AWS re:Invent 2019」で、5GキャリアのエッジロケーションにAWSのインフラを設置する「AWS Wavelength」を発表しました。 これにより5Gのモバイルデバイスから非常に小さなレイテンシでエッジロケーションに置かれたAWSのコンピュートやストレージなどにアクセスできるようになります。 次世代のモバイル通信サービスとして期待されている、いわゆる「5G」は、大容量で低レイテンシなネットワークを実現します。 しかしこの5Gネットワークを通じて、モバイルデバイスからAWSのようなパブリッククラウドへアクセスしようとすると、5Gキャリアのネットワークからイン

                                                  5GキャリアのエッジロケーションにAWSを設置、モバイルデバイスから利用できる「AWS Wavelength」発表。国内ではKDDIが提携。AWS re:Invent 2019
                                                • Kubernetes の upstream のキャッチアップ

                                                  先日、Kubernetes Meetup Tokyo #59 で「KEP から眺める Kubernetes」というタイトルで発表しました。発表の後で Kubernetes の upstream のキャッチアップ方法について質問を受けました。その場で回答はしたのですが、ちょうど社内の共有会で似たような話をしたところだったので、加筆修正したものを公開しておきます。 はじめに Kubernetes の upstream を追いかけ始めて 1 年ちょっと経ったので、その経験をまとめます。Kubernetes の upstream やエコシステムを観察しているだけで、コントリビュータではありません。間違っている部分があったらごめんなさい...! Kubernetes の開発体制や開発者の所属組織の分布、新しい機能を追加する際のプロセスの話を簡単にしてから私のキャッチアップ方法についてまとめています。

                                                    Kubernetes の upstream のキャッチアップ
                                                  • FAANSにおけるCloud RunからGKE Autopilotへのリプレイス事例 - ZOZO TECH BLOG

                                                    はじめに こんにちは。ブランドソリューション開発本部 WEAR部 SREの笹沢(@sasamuku)です。 FAANSはショップスタッフの効率的な販売をサポートするスタッフ専用ツールです。FAANSの一部機能は既にリリースされており全国の店舗で利用いただいております。正式リリースに向け、WEARと連携したコーディネート投稿機能やその成果をチェックできる機能などを開発中です。 FAANSのコンテナ基盤にはCloud Runを採用しており、昨年にSREとしての取り組みをテックブログでご紹介しました。しかし、運用していく中で機能需要や技術戦略の変遷があり、Cloud RunからGKE Autopilotへリプレイスすることを決めました。本記事ではリプレイスの背景と、複数サービスが稼働している状況下でのリプレイス方法についてご紹介します。 目次 はじめに 目次 リプレイスの背景 なぜCloud R

                                                      FAANSにおけるCloud RunからGKE Autopilotへのリプレイス事例 - ZOZO TECH BLOG
                                                    • Amazon CloudWatch での Prometheus メトリクスの使用 | Amazon Web Services

                                                      Amazon Web Services ブログ Amazon CloudWatch での Prometheus メトリクスの使用 Imaya Kumar Jagannathan、Justin Gu、Marc Chéné、および Michael Hausenblas 今週の初めに、AWS は CloudWatch Container Insights での Prometheus メトリクスモニタリングの公開ベータ版サポートを発表しました。この記事では、ユーザーがプロビジョニングする AWS クラスター上の Amazon Elastic Kubernetes Service (EKS) および Kubernetes で、コンテナ化されたワークロードに新しい Amazon CloudWatch 機能を使用する方法をご紹介します。 Prometheus は Cloud Native Compute

                                                        Amazon CloudWatch での Prometheus メトリクスの使用 | Amazon Web Services
                                                      • Argo Workflowsを使った機械学習環境の構築手順 - アダコテック技術ブログ

                                                        はじめに テックリードの柿崎です。私たちは、機械学習のパラメータチューニングを効率よく行うため、KubernetesネイティブのワークフローエンジンであるArgo Workflowsを採用しています。この記事では、その導入手順の要点を紹介いたします。 導入の目的 Argo Workflows導入以前は機械学習のパラメータチューニングを行うにあたり以下の機能を独自に実装しており、属人化していました。 パラメータ探索のアルゴリズム インスタンスのスケーリング インスタンスの稼働状況の可視化 ジョブの進行状況の可視化 これらをより柔軟に活用できるようにして、開発、更新サイクルを早めていくことが導入の目的です。 前提条件 Kubernetes(EKS)はすでに構築済みであること Kubernetes、Helmについての基本的な知識があること Argo Workflowsの基本的な知識があること K

                                                          Argo Workflowsを使った機械学習環境の構築手順 - アダコテック技術ブログ
                                                        • みてねのSREによるグローバルサービスの体験を向上させる技術 | gihyo.jp

                                                          株式会社MIXIで『家族アルバム みてね』(⁠以下みてね)のSREグループに所属している尾関です。 みてねは2017年より海外でもサービス展開していまして、1,500万人を超えるユーザに175の国と地域でサービスを提供しています。そのうち3割以上が海外ユーザになります(2022年8月現在⁠)⁠。 事業としても市場規模の大きさから海外ユーザをもっと伸ばしていくことに注力しており、その中でSREグループは「世界中の家族が快適かつ安心に使えるサービスを提供する。」をミッションに掲げてきました。 本記事では、世界中の家族が快適に使うために行ってきたことの一部を紹介させていただきます。 これまでの改善の歴史 2017年:海外展開スタート 2015年のサービスリリース当時、みてねのバックエンドインフラはAWSの東京リージョンで構築していました。 そして2017年より海外展開を開始しましたが、当時はまだ

                                                            みてねのSREによるグローバルサービスの体験を向上させる技術 | gihyo.jp
                                                          • HERP における Web フロントエンド開発概観 (2022年春編)

                                                            はじめに# この記事は,HERP における Web フロントエンド開発の概観を,世間の開発者に——特に潜在的・顕在的な候補者の方に——知ってもらうことを目的として書かれた.HERP では現在 Web フロントエンドエンジニアを積極的に募集しているが,仮に入社したとしてどのような仕事をすることになるかのイメージが付いた方が,検討の候補に入れてもらいやすいのではないかという目論見による.また,採用している技術スタックにも珍しいものがあるため,単純に読み物として楽しめるかもしれない.なお,開発の実情について知ってもらうのが目的であり,実装の良し悪しについて議論することは目的としていない. HERP でのアプリケーション開発# B2B SaaS として,主に IT スタートアップ企業向けの,採用管理システムおよびタレントプールシステムを開発・提供している. そもそもプロダクトを通じて何を実現したい

                                                            • AWS&Azure&GCPの凄腕エンジニアが激論!「雲の中心で愛を叫ぶ! クラウド横断パネルディスカッション」レポート(完全版) #devsumi | DevelopersIO

                                                              2020年02月13日(木)〜14日(金)の2日間、目黒雅叙園で開催された『Developers Summit 2020』。 通称"デブサミ"と呼ばれているこのカンファレンスイベントには、私自身2013年から参加しており(この時は一般枠として)、翌2014年からはいわゆる『プレス枠』として参加させて頂き、翔泳社様のメディアサイト『CodeZine』にレポートを寄稿させて頂いていました。(※これまでの寄稿情報については以下ページをご参照ください) そして今年2020年も、引き続きプレス枠として参加しました! 当エントリは寄稿エントリとして聴講したものの中から、Developers.IOでも是非レポートしておきたい!というセッションについてレポートしたいと思います。同僚の濱田孝治が登壇した「雲の中心で愛を叫ぶ! クラウド横断パネルディスカッション」です。 目次 セッション概要 セッションレポー

                                                                AWS&Azure&GCPの凄腕エンジニアが激論!「雲の中心で愛を叫ぶ! クラウド横断パネルディスカッション」レポート(完全版) #devsumi | DevelopersIO
                                                              • アソビューにおけるSREとは?4,000万人のアクセスに耐えられるインフラと高い信頼性を目指して - asoview! Tech Blog

                                                                この記事は、アソビュー! Advent Calendar 2022の12日目です。(裏面です) アソビューでSREユニットに所属をしている三森です。この記事では弊社のSREについて紹介をしようと思います。 アソビューでのSREとは? SREの指針とは? 信頼性 全体最適 DevSecOps こういうことやってるよ! 最後に アソビューでのSREとは? アソビューでのSREとはGoogleが提唱した「Site Reliability Engineering」の考え方を基本にしておりますが、インフラ/運用の上に乗るサービス、その先に居る顧客までを見据えて改善活動を積み上げるチームとしています。 www.wantedly.com SREの指針とは? アソビューはビジョンとして、「2025年までに、4000万もの人々に遊びを通じて、素敵な思い出をお届けする」を掲げています。 このビジョンの実現する

                                                                  アソビューにおけるSREとは?4,000万人のアクセスに耐えられるインフラと高い信頼性を目指して - asoview! Tech Blog
                                                                • Amazon EKS上でアプリケーションをGraceful Shutdownさせる際に注意すべきポイント | 株式会社ヌーラボ(Nulab inc.)

                                                                  SRE課で、主にBacklogのSREを担当しているMuziです。 物理サーバやインスタンスで動作していたアプリケーションを、Kubernetesクラスタに移行する際には、いままで暗黙的に存在していた前提に目を向ける必要があります。そのような前提を無視すると、アプリケーションは動作したとしても、可用性が悪化する可能性があるためです。 私たちがBacklogをEC2インスタンスからKubernetesクラスタに移行した際にも、可用性の悪化に繋がる問題に対処する必要が生じました。今回は、そのような問題の一つであるGraceful Shutdownに関する注意点を、私たちの実体験をもとにご紹介します。 なお、以下の内容はAmazon EKSのKubernetesバージョン1.22で確認しました。Amazon EKSに固有の話題も含みますが、Kubernetes全般に共通する部分も多いかと思います

                                                                    Amazon EKS上でアプリケーションをGraceful Shutdownさせる際に注意すべきポイント | 株式会社ヌーラボ(Nulab inc.)
                                                                  • Recommended alarms - Amazon CloudWatch

                                                                    The following sections list the metrics that we recommend that you set best practice alarms for. For each metric, the dimensions, alarm intent, recommended threshold, threshold justification, and the period length and number of datapoints is also displayed. Some metrics might appear twice in the list. This happens when different alarms are recommended for different combinations of dimensions of th

                                                                    • Continuous delivery of container applications to AWS Fargate with GitHub Actions | Amazon Web Services

                                                                      AWS Open Source Blog Continuous delivery of container applications to AWS Fargate with GitHub Actions At the day two keynote of the GitHub Universe 2019 conference on Nov 14, Amazon Web Services announced that we have open sourced four new GitHub Actions for Amazon ECS and ECR. Using these GitHub Actions, developers and DevOps engineers can easily set up continuous delivery pipelines in their code

                                                                        Continuous delivery of container applications to AWS Fargate with GitHub Actions | Amazon Web Services
                                                                      • アソビュー!でのEKSクラスターの今までとこれから - asoview! Tech Blog

                                                                        こんにちは、アソビュー!SREチームのkirimaruです。 コロナも少し落ち着き、皆さんもGWは大いに満喫していたのではないでしょうか。 残念ながら僕は本を読んで引きこもっていましたが......。 以前「アソビュー!がECSではなくEKSを選んだ理由」という内容でランサーズさんとのイベントでお話させていただきました。 speakerdeck.com 今回はこの時から約2年、アソビュー!がEKSとどう向き合ってきたのか、どう向き合っていくのかを採用している技術とともにご紹介できればと思います。 Intro 前述のイベントでは「大量のAWSアカウントとECSクラスターの管理が辛いから、整理してEKSに統合していくぞ!」とお話させていただきました。このイベントは2020年ですが、2019年に試験的にEKSを導入し、2020年に本格移行の意思決定を行っています。SREチームはまだまだ人数が少な

                                                                          アソビュー!でのEKSクラスターの今までとこれから - asoview! Tech Blog
                                                                        • AWSとFacebookが機械学習「PyTorch」で協力。「TorchServe」と「TorchElastic」をオープンソースでリリース

                                                                          AWSとFacebookが機械学習「PyTorch」で協力。「TorchServe」と「TorchElastic」をオープンソースでリリース 機械学習ライブラリ「PyTorch」の開発チームは、PyTorch 1.5のリリースと同時に、AWSとFacebookが協力して開発した新たなライブラリ「TorchServe」と「TorchElastic」を発表しました(AWSによる発表)。 TorchServe and [TorchElastic for Kubernetes], new libraries for serving and training models at scale. Learn more: https://t.co/j6tSOaG6yU — PyTorch (@PyTorch) April 21, 2020 PyTorchはFacebookのAIリサーチラボが開発した、Py

                                                                            AWSとFacebookが機械学習「PyTorch」で協力。「TorchServe」と「TorchElastic」をオープンソースでリリース
                                                                          • Amazon EKS ワーカーノードの謎を解くクラスターネットワーク | Amazon Web Services

                                                                            Amazon Web Services ブログ Amazon EKS ワーカーノードの謎を解くクラスターネットワーク AWS で Kubernetes を実行するには、AWS のネットワーク設定と Kubernetes のネットワーク要件の両方を理解する必要があります。デフォルトの Amazon Elastic Kubernetes Service (Amazon EKS) の AWS CloudFormation テンプレートを使用して、Amazon Virtual Private Cloud (Amazon VPC) と Amazon EC2 ワーカーノードをデプロイすると、通常の場合、すべて機能します。しかし、設定に小さな問題があると、エラーが発生してイライラさせられることがあります。 このブログでは、Amazon VPC を設定するさまざまな方法を見ながら、Amazon EKS が

                                                                              Amazon EKS ワーカーノードの謎を解くクラスターネットワーク | Amazon Web Services
                                                                            • Flux + Helm における即時ロールバック - クックパッド開発者ブログ

                                                                              こんにちは。SRE の小川 (@coord_e) です。先日の投稿にあった通り、クックパッドはレシピサービスをグローバル版に統合しました。サービスの統合に伴って、開発や運用のインフラもグローバルチームで利用されているものを使うことになりました。 運用インフラの中でも特に大きな違いとして、日本とグローバル版ではコンテナオーケストレーションの仕組みが異なっています。日本では Amazon Elastic Container Service (ECS) を使ってコンテナを実行していますが、グローバル版では Amazon Elastic Kubernetes Service (EKS) の上でコンテナを実行しています。 また開発面ではデプロイフローに大きな違いがあります。日本では、アプリケーションの新しいリビジョンのデプロイは ChatOps によって行なっていました。main ブランチに PR

                                                                                Flux + Helm における即時ロールバック - クックパッド開発者ブログ
                                                                              • 2019年11月後半アップデート&AWS re:Invent 2019 サービス別トピック総まとめ #reinvent | DevelopersIO

                                                                                今年2019年の『AWS re:Invent』も先日全ての日程を終了し、数多くの新機能新サービスが発表されました。その詳細については当ブログでもポータルサイトを展開し、 また、例年通り参加レポートや技術検証ブログ等を書きまくっております。 AWS re:Invent 2019 | シリーズ | Developers.IO ですが、今年は(今年も?)『AWS re:Invent 2019』本編開始前にも数多くの新機能、または幾つかの新サービスも発表されていました。その数がこれまた非常に多く、『本編開始前にこれだけ出てくるってことはこの後(re:Invent 2019は)どうなるんだ...?』と思った方も多かったのではないでしょうか。 本編開始前の内容についてはAWSJ公式ブログでまとめられたエントリが計5本あり、また本編に関しても計5日分の日毎まとめとして、AWSJ公式ブログでその内容がまと

                                                                                  2019年11月後半アップデート&AWS re:Invent 2019 サービス別トピック総まとめ #reinvent | DevelopersIO
                                                                                • コンテナの世界での AWS Fargate の役割 | Amazon Web Services

                                                                                  Amazon Web Services ブログ コンテナの世界での AWS Fargate の役割 2017 年、AWS は、AWS Fargate と呼ばれる大規模なコンテナを実行するサーバーレスサービスを導入しました。今日、お客様は毎週何百万ものコンテナをローンチしています。お客様が Fargate を好むのは、多くのインフラストラクチャにまつわる未分類の重労働から解放してくれるからだと繰り返し伝え聞いています。たとえば、お客様は EC2 フリートまたはコンテナランタイムのサイズ変更、スケーリング、パッチ適用、更新について責任を負う必要がなくなりました。 過去 2 年間で気付いたのは、Fargate は非常に斬新なアイデアであることから、お客様の中には大規模な AWS コンテナポートフォリオの特定のレイヤーに入れるのが難しいと感じていらっしゃる方もおられるということです。当社は、お客様

                                                                                    コンテナの世界での AWS Fargate の役割 | Amazon Web Services