並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 77件

新着順 人気順

reliabilityの検索結果1 - 40 件 / 77件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

reliabilityに関するエントリは77件あります。 SRE開発google などが関連タグです。 人気エントリには 『Enterprise Roadmap to SRE - Google - Site Reliability Engineering』などがあります。
  • Enterprise Roadmap to SRE - Google - Site Reliability Engineering

    Google が過去に出版した 2 冊の書籍「Site Reliability Engineering」と「The Site Reliability Workbook」は、サービスライフサイクル全体への取り組みによって、組織がソフトウェアシステムの構築、展開、監視、保守を成功させる方法と理由を示しています。本レポートでは、Google Cloud Reliability Advocate の Steve McGhee と Google Cloud Solutions Architect の James Brookbank が、組織で SRE を導入する際にエンジニアが直面する特定の課題について深く掘り下げています。 SRE の普及にもかかわらず、多くの企業では SRE に対する当初の熱意と、その採用の度合いの間に大きな隔たりが生じています。本レポートは、プロダクトオーナーや信頼性の高いサー

    • スクウェア・エニックスの"とあるシステム"のSite Reliability Engineering

      はじめに こんにちは、情報システム部 SRE 橋本です。 普段はクラウドエンジニア(SRE)としてチームリードをしています。興味関心がインフラ、Observability、SRE、Security、Golangといった分野であり、 Japan Google Cloud Usergroup for Enterprise(Jagu’e’r ジャガーと読みます)でObservability/SRE分科会のオーナーを担当させていただいております。その縁もあって先日Innovators Hive at Cloud Next 2022でコミュニティ運営についてお話をさせていただきました。 この記事では現在チームリードをしていてビルドアップ中でもあるSREチームについて考えていることをお話したいと思います。 また、このSREチームについてのインタビュー記事も掲載いたしました。メンバーやチームの雰囲気を伝

        スクウェア・エニックスの"とあるシステム"のSite Reliability Engineering
      • 信頼性目標とシステムアーキテクチャー / Reliability Objective and System Architecture

        SRE NEXT 2023で発表した内容です。 https://www.youtube.com/live/c_oMpshssRg?si=LfArG3rX4VXPJ30H&t=27643

          信頼性目標とシステムアーキテクチャー / Reliability Objective and System Architecture
        • Google - Site Reliability Engineering

          Written by: Heather Adkins, Betsy Beyer, Paul Blankinship, Ana Oprea, Piotr Lewandowski, Adam Stubblefield Can a system be considered truly reliable if it isn't fundamentally secure? Or can it be considered secure if it's unreliable? Security is crucial to the design and operation of scalable systems in production, as it plays an important part in product quality, performance, and availability. In

          • ヘルスケアデータをGrafanaで見たくない…?〜健康 Reliability Engineering〜

            Blueskyのフォローお願いします! はじめに まずはこちらをご覧ください。 これは私のApple Watchで計測されたヘルスケアデータです。Apple Watchをつけていると、心拍数や歩数、睡眠時間などのデータが自動的にiPhone内に記録されます。 SREなら健康を維持するためにもSLIとSLOを設定して可視化するべきですよね? SREなら健康エラーバジェットが無くなりそうだったら「今すぐ寝ましょう!」と架電が来て欲しいですよね? 普通にやるとiOSアプリを用いて直接ヘルスケアデータを確認することになりますが、Web系のSRE的なエンジニアとしてはやはり業界標準の技術で可視化したいところです。 また、iOSアプリを開発するのは専門知識が必要となり非常に骨が折れる作業です。そもそもMacがないとできないですし。 そこで、今回は Apple Watchのヘルスケアデータを 全自動で良

              ヘルスケアデータをGrafanaで見たくない…?〜健康 Reliability Engineering〜
            • GitHub - facebook/lexical: Lexical is an extensible text editor framework that provides excellent reliability, accessibility and performance.

              import {$getRoot, $getSelection} from 'lexical'; import {useEffect} from 'react'; import {LexicalComposer} from '@lexical/react/LexicalComposer'; import {PlainTextPlugin} from '@lexical/react/LexicalPlainTextPlugin'; import {ContentEditable} from '@lexical/react/LexicalContentEditable'; import {HistoryPlugin} from '@lexical/react/LexicalHistoryPlugin'; import {OnChangePlugin} from '@lexical/react/

                GitHub - facebook/lexical: Lexical is an extensible text editor framework that provides excellent reliability, accessibility and performance.
              • ZOZOTOWNのProduction Readiness Checklistと信頼性向上の取り組み / Improvement the reliability of ZOZOTOWN with Production Readiness Checklist

                ZOZOTOWNのProduction Readiness Checklistと信頼性向上の取り組み / Improvement the reliability of ZOZOTOWN with Production Readiness Checklist

                  ZOZOTOWNのProduction Readiness Checklistと信頼性向上の取り組み / Improvement the reliability of ZOZOTOWN with Production Readiness Checklist
                • AWSが定義する信頼性とは?Well-Architected Frameworkの『Reliability』ペーパーが群を抜いて面白い件(日本語ガイド) | DevelopersIO

                  こんにちは。DA事業本部の春田です。 AWSには様々な種類のホワイトペーパーが提供されていますが、『Reliability(信頼性)』のホワイトペーパーを読んだことはありますか?Well-Architectedフレームワーク五本柱のうちの一つです。ソリューション・アーキテクトを目指す方にとってはお馴染みでしょう。 このペーパー、めちゃめちゃ丁寧かつ面白いんですよ。読んだことがある人にはわかると思うのですが、5つのWell-Architectedフレームワークのホワイトペーパーのうち、『Reliability』だけ気合の入れ方が違っていて、他のペーパーよりも用語の定義や具体例が豊富なため、アーキテクトの経験がなくてもイメージがしやすいものになっています。また、各観点を表にまとめてくれているので、困ったときにパッと見れるTips集的にも使えます。AWSのサービスに絡めた説明が多いですが、システ

                    AWSが定義する信頼性とは?Well-Architected Frameworkの『Reliability』ペーパーが群を抜いて面白い件(日本語ガイド) | DevelopersIO
                  • Site Reliability を向上するためにやったことすべて

                    ペパボ・はてな技術大会で発表した内容になります

                      Site Reliability を向上するためにやったことすべて
                    • Customer Reliability Engineer ー エンジニアとの信頼関係をつくる仕事

                      2019.9.7 DevRel/Japan Conference 2019

                        Customer Reliability Engineer ー エンジニアとの信頼関係をつくる仕事
                      • Google - Training Site Reliability Engineers

                        Training Site Reliability Engineers: What Your Organization Needs to Create a Learning Program Written by: Jennifer Petoff, JC van Winkel & Preston Yoshioka with Jessie Yang, Jesus Climent Collado & Myk Taylor Providing training and education for Site Reliability Engineers is universally important to set them up for success in your organization. However, the specific training needs of each enginee

                        • 【Team & Project】 Verda Platformに対する Site Reliability Engineering に関わる業務を担当しているチームを紹介します

                          ―― まず、自己紹介をお願いします。 Park: LINEのプライベートクラウドであるVerda について、SRE活動をミッションとしているVerda Reliability Engineering Team(以下VRE)のマネージャーをしています。VREチームは日本、韓国の2拠点に跨がるチームで、その両方に対してマネジメントを行なっています。 山田:VREチームでシニアエンジニアとして働いています。クラウドインフラの開発・運用には数多くのレイヤの技術が使われていますが、その中でも特にサーバやOSといった比較的低レイヤな部分に対するSREをメインに実施しています。具体的には、OSレベルのトラブルシューティングやクラウドリソースのキャパシティ管理、物理リソースの調達に関する業務改善などがメインミッションです。 Kang: 2019年度の新卒として韓国側のチームにジョインしました。入社前は大学

                            【Team & Project】 Verda Platformに対する Site Reliability Engineering に関わる業務を担当しているチームを紹介します
                          • データの価値を失わないためのData Reliability

                            dbtを活用したデータ基盤の 論理・物理設計の現在地と振り返り / data warehouse logic design by using dbt

                              データの価値を失わないためのData Reliability
                            • AWS vs GCP reliability is wildly different

                              Cloud compute is usually seen as an ethereal resource. You launch VMs and spin them down, billed to the second. The billing and the mental model make it seem like these resources are limitless. That's typically one of the selling points versus on-prem compute. They can scale responsively to your load so you're not paying for excess compute that you don't need but it's there when you want it. Of co

                              • 「開発者のための最高の環境をつくる 」をミッションに新設されたReliability Engineeringセンターを紹介します

                                LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINEの開発組織のそれぞれの部門やプロジェクトについて、その役割や体制、技術スタック、今後の課題やロードマップなどを具体的に紹介していく「Team & Project」シリーズ。今回は「エンジニアに価値ある環境とツールを作る 」「環境とツールをより価値あるものにする方法を探し出して実行する 」をミッションに設立された、Reliability Engineeringセンター(REC)を紹介します。 RECのセンター長である片野をはじめ、室長やマネージャーを務めるLINEのエンジニアたちに話を聞きました。 ―― センター設立の背景、目的、コンセプトなどを教えてください 片野: RECのセンター長を務めている片野です。LINEの開

                                  「開発者のための最高の環境をつくる 」をミッションに新設されたReliability Engineeringセンターを紹介します
                                • Platform Engineering と Site Reliability Engineering について - Qiita

                                  この記事はスタンバイ Advent Calendar 2022の12日目の記事です。 Platform Engineering と Site Reliability Engineering(以下SRE) について考えていきたいと思います。 この記事の目的 この記事では SREという言葉の定義と最近の取り組み事例についての考察 Platform Engineeringという考えの紹介 Platform EngineeringとSRE の相違点、共通点 について書きたいと思います。 これは決して特定の個人や団体の考えを否定するものではなく、ご自身のキャリアや組織を考える際のヒントとして使って頂けたら幸いです。 SREという言葉 まずはSREという言葉について確認してみましょう。 O'Reilly Japan - SRE サイトリライアビリティエンジニアリングによると、 (開発/運用の分断に対し

                                    Platform Engineering と Site Reliability Engineering について - Qiita
                                  • Data Reliability Engineering をはじめた話 | メルカリエンジニアリング

                                    こんにちは、メルカリUS でData Engineerをしている @hatone です。 メルカリUSのData Engineering Team(DEチーム) では、MLやBI、会計、マーケティングなど、多岐にわたるチームとプロダクトにデータを提供する必要不可欠なパイプラインを担当しています。 今年の7月に Data Reliability Engineering Team (DRE: データ信頼性エンジニアリングチーム) というチームを立ち上げました。日々増え続けるDB上のレコードとそのデータの活用を滞りなく実現するため、Data Engineeringに対しDevOpsとSREの原則を適用することでスケールさせていこうとしています。 Mercari Advent Calendar 2022 の19日目では、チーム各々が安心してデータを利用できるようプロジェクトパイプラインの監視・自動

                                      Data Reliability Engineering をはじめた話 | メルカリエンジニアリング
                                    • 礼節から育てるチームの健康と信頼性 / Improve team health and reliability starting with civility

                                      2020-02-13 Developers Summit 2020 13-C-6 see also : https://dev.classmethod.jp/etc/devsumi-2020-13-6-c-kwappa/

                                        礼節から育てるチームの健康と信頼性 / Improve team health and reliability starting with civility
                                      • How We Foster Reliability in Diversity

                                        SRE NEXT 2022 の基調講演の資料です。 https://sre-next.dev/2022/schedule#kc01

                                          How We Foster Reliability in Diversity
                                        • MackerelチームのCustomer Reliability Engineerになりました - yasuhisa's blog

                                          2020/02からMackerelチームのCRE (Customer Reliability Engineer) になりました。もうちょっと早くエントリを書く予定でしたが、職種が変わった & 期初であれこれイベントが多いということで遅くなってしまった...。 CREになろうと思ったきっかけ 一番大きいきっかけはid:missasanと前期一緒に働けたことだろうなぁと思います。id:missasanはCREであり、現在はCREチームのマネージャーをされています。私がアプリケーションエンジニアとして働いていたとき、id:missasanを含むCREとももちろん一緒に仕事をしていたわけ*1ですが、大きくタスクフォースを一緒に組んで仕事をするといったことはあまりありませんでした。そんな中、今年の夏にid:missasanが通称赤本の読書会をチーム内で始めたので、私もほぼ毎回参加しました。 カスタマ

                                            MackerelチームのCustomer Reliability Engineerになりました - yasuhisa's blog
                                          • Site Reliability Engineer, Apple Pay - Jobs at Apple (JP)

                                            The Apple team is growing! Apple Pay is an exciting environment and a fast-paced development organization. We are changing the landscape of payments through innovation enabling our customers to pay with their mobile devices in a simple, private and secure way. The Apple Pay SRE Team is looking for an outstanding site reliability engineer in Tokyo focused on the front line customer experience and t

                                            • Google Cloud Architecture Framework: Reliability  |  Cloud Architecture Center

                                              Accelerate your digital transformation Whether your business is early in its journey or well on its way to digital transformation, Google Cloud can help solve your toughest challenges.

                                                Google Cloud Architecture Framework: Reliability  |  Cloud Architecture Center
                                              • 自ら作り上げるワクワクを体験できるのが魅力 システム設計・インフラ構築・運用までを一手に担うNetwork Reliability Engineerの仕事

                                                LINEのITサービスセンターの中から、LINEの大規模なネットワークを支えるネットワークエンジニアのチームや仕事内容について紹介する「LINE ネットワークエンジニア採用説明会」。ここで登壇したのは、ネットワーク室 ネットワークオペレーションチームの酒井亨氏。ネットワークオペレーションチームとNetwork Reliability Engineer(NRE)について紹介しました。 ネットワークの業務課題をソフトウェアの力で解決するNetwork Reliability Engineer 酒井亨氏:それでは、「LINE Network Operation Frontline」と題して、ネットワークオペレーションチーム、そして募集中のポジションであるNetwork Reliability Engineerについて紹介いたします。 スピーカーを務める酒井と申します。経歴ですが、新卒入社のSIe

                                                  自ら作り上げるワクワクを体験できるのが魅力 システム設計・インフラ構築・運用までを一手に担うNetwork Reliability Engineerの仕事
                                                • GitHub - upgundecha/howtheysre: A curated collection of publicly available resources on how technology and tech-savvy organizations around the world practice Site Reliability Engineering (SRE)

                                                  How They SRE How They SRE is a curated knowledge repository of Site Reliability Engineering (SRE) best practices, tools, techniques, and culture adopted by leading technology or tech-savvy organizations. Numerous organizations frequently share their insights and expertise, encompassing best practices, tools, and techniques that shape their engineering culture. They do this through various public p

                                                    GitHub - upgundecha/howtheysre: A curated collection of publicly available resources on how technology and tech-savvy organizations around the world practice Site Reliability Engineering (SRE)
                                                  • Incident Metrics in SRE - Google - Site Reliability Engineering

                                                    Incident Metrics in SRE - Google - Site Reliability Engineering Measuring improvements as a result of a process change, product purchase, or a technological change is commonplace. In reliability engineering, statistics such as mean time to recovery (MTTR) or mean time to mitigation (MTTM) are often measured. These statistics are sometimes used to evaluate improvements, or track trends. In this rep

                                                    • openai-cookbook/techniques_to_improve_reliability.md at main · openai/openai-cookbook

                                                      Techniques to improve reliability When GPT-3 fails on a task, what should you do? Search for a better prompt that elicits more reliable answers? Invest in thousands of examples to fine-tune a custom model? Assume the model is incapable of the task, and move on? There is no simple answer - it depends. However, if your task involves logical reasoning or complexity, consider trying the techniques in

                                                        openai-cookbook/techniques_to_improve_reliability.md at main · openai/openai-cookbook
                                                      • Google - Site Reliability Engineering

                                                        If you’re rolling out a large-scale infrastructure change, you know it can be like swapping out a jet engine while flying. Staying aloft takes coordination and communication with many teams, good processes and documentation, risk identification and management, monitoring, and tracking of the change progress—not to mention dealing with the catastrophic challenges that crop up midflight. In this rep

                                                        • Google - Site Reliability Engineering

                                                          What is Site Reliability Engineering (SRE)? SRE is what you get when you treat operations as if it’s a software problem. Our mission is to protect, provide for, and progress the software and systems behind all of Google’s public services — Google Search, Ads, Gmail, Android, YouTube, and App Engine, to name just a few — with an ever-watchful eye on their availability, latency, performance, and cap

                                                          • 良いSRE(Site Reliability Engineer)、悪いSRE - Speee DEVELOPER BLOG

                                                            お疲れ様です、2週間前に思いついた自作キーボードがさっき完成したSREの西田(k.bigwheel)です。 初めて自分で設計したキーボードが完成!名前はuni48にしました🌚 #自作キーボード pic.twitter.com/wFxz6DoVvn— k.bigwheel⌨️🦀🖊️ SREエンジニア@Speee株式会社 (@k_bigwheel) 2020年12月29日 僕がSRE(Site Reliability Engineer)という職種を知ったのは一年前のSpeeeの採用面接の中でした。SREになったのも入社のときからなのでやっと1年経ったばかりですね〜。 この1年のSREとしての自分を振り返ると、元バックエンド屋・インフラ屋としての経験もあって技術選定やアーキテクチャ的な面での大きな失敗は幸いにしてありませんでした。 発生した失敗もすべて想定の範囲内でその面ではよく価値を発揮

                                                              良いSRE(Site Reliability Engineer)、悪いSRE - Speee DEVELOPER BLOG
                                                            • The Many Shapes of Site Reliability Engineering

                                                              In my role as a Cloud and SRE Practice Lead at Slalom Build, I am fortunate to talk to a wide range of organizations, from smaller mid-market companies all the way to astoundingly large and complex enterprises, all from an equally wide range of industries. There is no doubt about it, Site Reliability Engineering (SRE) is the latest hot topic. These companies are looking to reduce the impact and ri

                                                                The Many Shapes of Site Reliability Engineering
                                                              • Keeping Customers Streaming — The Centralized Site Reliability Practice at Netflix

                                                                By Hank Jacobs, Senior Site Reliability Engineer on CORE We’re privileged to be in the business of bringing joy to our customers at Netflix. Whether it’s a compelling new series or an innovative product feature, we strive to provide a best-in-class service that people love and can enjoy anytime, anywhere. A key underpinning to keeping our customers happy and streaming is a strong focus on reliabil

                                                                • Customer Reliability Engineer の発展的な職務領域についての覚書 - satoshihirose.log

                                                                  Customer Reliability Engineering とは 現在の自分は B2B SaaS の技術サポートを提供するチームの中で Customer Reliability Engineer (CRE)として働いている。 Customer Reliability Engineering は 2016 年に Google が提唱し始めた職務領域で、Google 社内で蓄積した Site Reliability Engineering のノウハウを Google Cloud ユーザーのアプリケーション(サイト)にも適用してコミットしていこうというアプローチだ。つまり、Google が提唱する CRE は Customer('s Site) Reliability Engineering のようなものと言える。 そのミッションは、 Drive Customer Anxiety -> 0

                                                                    Customer Reliability Engineer の発展的な職務領域についての覚書 - satoshihirose.log
                                                                  • RCM(Reliability centered maintenance)の化学プラントでの考え方

                                                                    記事内に広告が含まれています。This article contains advertisements. RCMという保全方式について解説します。 TBM,CBM,BMという3大保全方式に変わる4大目というわけではなく、さらに深堀した方法だと考えれば良いでしょう。 メンテナンス業界としては目新しい方式ではありませんが、社内のメンテナンスに四苦八苦しているとこういう情報をキャッチできないまま、時代が過ぎ去っていきます。 かくいう私の職場も全く同じで、TBMやCBMという用語ですらこの10年で浸透してきたイメージです。 RCMという考え方を知らずに社内で議論しているうちに、必然的にこの考え方にたどり着いた感じがします。 確立させるには、担当者のマインドを変える大きなリーダーシップが必要となるので、相当の時間が掛かることでしょう。 RCMとはRCMとはReliability centered m

                                                                      RCM(Reliability centered maintenance)の化学プラントでの考え方
                                                                    • Site Reliability Engineering (SRE)  |  Google Cloud

                                                                      Accelerate your digital transformation Whether your business is early in its journey or well on its way to digital transformation, Google Cloud can help solve your toughest challenges.

                                                                        Site Reliability Engineering (SRE)  |  Google Cloud
                                                                      • Site Reliability Engineering for GMO

                                                                        GMOインターネットグループの研修でお話しました。

                                                                          Site Reliability Engineering for GMO
                                                                        • Deployment reliability at GitHub

                                                                          EngineeringDeployment reliability at GitHubLast week, we described how we improved the deployment experience for github.com. When we describe deployments at GitHub, the deployment experience is an important part of what it takes to ship applications to production, especially at GitHub's scale, but there is more to it: the actual deployment mechanics need to be fast and reliable. Welcome to another

                                                                            Deployment reliability at GitHub
                                                                          • Enterprise Roadmap to SRE - Google - Site Reliability Engineering

                                                                            Google が過去に出版した 2 冊の書籍「Site Reliability Engineering」と「The Site Reliability Workbook」は、サービスライフサイクル全体への取り組みによって、組織がソフトウェアシステムの構築、展開、監視、保守を成功させる方法と理由を示しています。本レポートでは、Google Cloud Reliability Advocate の Steve McGhee と Google Cloud Solutions Architect の James Brookbank が、組織で SRE を導入する際にエンジニアが直面する特定の課題について深く掘り下げています。 SRE の普及にもかかわらず、多くの企業では SRE に対する当初の熱意と、その採用の度合いの間に大きな隔たりが生じています。本レポートは、プロダクトオーナーや信頼性の高いサー

                                                                            • Reliabilityを高めるために最短距離を走る LINEのコンテンツプラットフォームSREの仕事

                                                                              LINEユーザーとビジネスの価値をつなぐためのSREとは、いったいどんなことをするのか。LINEの7つの領域から9名が登壇し、業務内容や体制、開発における課題、働く個々人のやりがいなどについて話します。加藤俊弥氏は、LINEのコンテンツプラットフォームのSREについて紹介しました。 Redisのヘビーユーザー 加藤俊弥氏:加藤から「コンテンツプラットフォームのSRE」についてご紹介したいと思います。 まず私の紹介から失礼します。2014年に株式会社ドワンゴに入社しまして、niconicoのバックエンドのエンジニアをやっていました。 アプリケーションのエンジニアとして、ScalaやJavaなどを書いて、その後Web API GatewayのチームのリードやOAuthチームのリードを担当し、Redisのヘビーユーザーでもあったので、RedisのDBAも兼任していました。。 Redisのほうから

                                                                                Reliabilityを高めるために最短距離を走る LINEのコンテンツプラットフォームSREの仕事
                                                                              • GitHub - mxssl/sre-interview-prep-guide: Site Reliability Engineer Interview Preparation Guide

                                                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                                  GitHub - mxssl/sre-interview-prep-guide: Site Reliability Engineer Interview Preparation Guide
                                                                                • Site Reliability Engineering における 重要領域とパフォーマンス指標の提案 / Performance Indicators for SRE

                                                                                  2021/06/04 第8回WebSystemArchitecture研究会(オンライン) https://wsa.connpass.com/event/207143/

                                                                                    Site Reliability Engineering における 重要領域とパフォーマンス指標の提案 / Performance Indicators for SRE

                                                                                  新着記事