並び順

ブックマーク数

期間指定

  • から
  • まで

481 - 520 件 / 1127件

新着順 人気順

gkeの検索結果481 - 520 件 / 1127件

  • 世界130の工場をIoTでつなぐ––デンソーが“本気”で取り組む「内製化」の舞台裏

    2019年12月9日、株式会社デンソーが主催するイベント「DENSO Tech Links Tokyo #5」が開催されました。第5回となる今回のテーマは「デンソーが工場からソフトウェア内製化に挑む」。4.4万品番、120億個もの自動車部品を製造するデンソーの工場は、数多くのIoT技術によって支えられています。そんなデンソーのIoT技術の活用の裏側について、技術顧問の及川卓也氏と3人のデンソー社員が講演しました。講演は、株式会社デンソー 生産技術部 Factory IoT室の矢ヶ部弾氏、黒田雄大氏、澤田寛央氏の3人が登場。デンソーの工場のIoT化におけるソフトウェア開発の内製化について、「なぜ」「誰が」「どのように」取り組んでいるのか、それぞれ事例を交えつつ解説しました。 デンソーはなぜ、工場からソフトウェアを「内製化」するのか? 矢ヶ部弾 氏(以下、矢ヶ部):みなさんこんにちは、デンソー

      世界130の工場をIoTでつなぐ––デンソーが“本気”で取り組む「内製化」の舞台裏
    • Cloud Deploy - Fully Managed Continuous Delivery | Google Cloud

      Cloud Deploy makes continuous delivery to GKE, Cloud Run services and jobs, and Anthos easy and powerful. Define releases and progress them through environments, such as test, stage, and production. Cloud Deploy provides easy one-step promotion and rollback of releases via the web console, CLI, or API. Built-in metrics enable insight into deployment frequency and success.

        Cloud Deploy - Fully Managed Continuous Delivery | Google Cloud
      • GKE のオートスケール 5種類を概観する - QG Tech Blog

        はじめに平素は大変お世話になっております。 クイックガードのパー子です。 ここ 1〜2年の傾向として、弊社でも Kubernetes を扱う案件が増えてきております。 設計から構築、運用まで一貫してお任せいただくことも多いのですが、安定運用するうえでオートスケールの活用は欠かせません。 (というか、これを活用しないと Kubernetes の価値は半減です。) ところが、Kubernetes にはオートスケールの仕組みが何種類もあり、さらにプラットフォーム独自のスケーリング方式も含めると、初見者にはなかなか全貌が把握しづらいところでございます。 そこで、今回は Google Kubernetes Engine (GKE) を対象に、利用可能なすべてのスケーリング方式の概観をまとめてみました。 あくまで概観を眺めるのみに留めており、各方式の具体的な設定方法は説明しませんので、必要に応じてググ

          GKE のオートスケール 5種類を概観する - QG Tech Blog
        • GCP連載#1 Stackdriver Loggingへ良い感じのログ出力方法を考える | フューチャー技術ブログ

          はじめにGCPをテーマにした連載企画を始めるということで、初回はStackdriver Loggingの活用方法をまとめます。1記事でまとめるには手が余るほど様々な機能があるため、初回はログの出力とビューア周りといったアプリケーション開発者視点での機能に絞って説明していきます。利用コードはGoで書かれていますが、汎用的な内容なので他の言語でもある程度通じる内容にしているつもりです。 連載企画は以下の10本をほぼ連日投稿する予定です。お楽しみに! Stackdriver Loggingへ良い感じのログ出力方法を考える(この記事です) Istio on GKEではじめるサービスメッシュ Goでサーバーレスな管理画面アプリを作る Cloud Life Sciencesを見てみた 【もう鍵なくさない】GCPのSecret ManagerとBerglasで幸せになる Forseti Config V

            GCP連載#1 Stackdriver Loggingへ良い感じのログ出力方法を考える | フューチャー技術ブログ
          • 株式会社プレイド:Anthos clusters on AWS を活用し、マルチクラウドでも GKE 由来の高度なマネージド環境を享受 | Google Cloud 公式ブログ

            株式会社プレイド:Anthos clusters on AWS を活用し、マルチクラウドでも GKE 由来の高度なマネージド環境を享受 Web サイト訪問者やアプリ利用者の行動や情動をリアルタイムに解析し、適切なコミュニケーションをリアルタイムに提供できる CX プラットフォーム『KARTE(カルテ)』。マーケティング領域の SaaS として EC サイトをはじめ、人材、不動産、金融など幅広いサービスで導入が進む同サービスは、高速なレスポンスと優れた可用性を実現するためマルチクラウド環境でサービスを提供しています。そこで使われているのが Google Cloud のマルチクラウド プラットフォーム「Anthos」です。いち早くこのプロダクトを導入した同社にその活用のポイントを語っていただきました。 (利用している Google Cloud ソリューション) アプリケーションのモダナイゼーシ

              株式会社プレイド:Anthos clusters on AWS を活用し、マルチクラウドでも GKE 由来の高度なマネージド環境を享受 | Google Cloud 公式ブログ
            • Solr Operatorを利用したKubernetes上での検索システムの構築について - エニグモ開発者ブログ

              エンジニアの竹田です。 BUYMAの検索システムやMLOps基盤の開発・運用を担当しております。 今回はSolr Operatorによる検索システム構築を行いましたので、その実施内容と得られた知見についてご紹介したいと思います。 はじめに 昨期から今期にかけて、オンプレミスのシステムからの脱却、およびマイクロサービス化を目指し、商品検索システムのリプレイスを進めていました。 エニグモでは機能毎にApache Solrを用いた複数の検索システムを保持しており、クラウド移行に伴い、構築面や運用面の負担は大幅に軽減できております。 なお、リプレイスを行った商品検索システムの構成も下記の記事と大きくは変わっていません。 tech.enigmo.co.jp 今回フォーカスする検索システムの課題 検索システムの運用には、開発案件や障害対応、システムのバージョンアップやシステム増強作業などがあります。

                Solr Operatorを利用したKubernetes上での検索システムの構築について - エニグモ開発者ブログ
              • ビッグデータ活用時のワークフローの大切さ ZOZO研究所のエンジニアが感じた次元が違う300万画像の処理

                ZOZO Technologies Meetup は、「ZOZOテクノロジーズの大規模データ活用に興味のある方」を対象としたイベントです。ZOZO研究所の渡辺氏からは大規模データを対象とした画像検索システムのワークフローについての事例を紹介しました。後半は画像検索のワークフローの流れについて。 画像検索のワークフローの流れ 渡辺慎二郎氏:というところの話になってきて、これがワークフロー、それを毎日のように準備するという仕組みになります。先ほど見せた図で言うと、この部分ですね。 このワークフロー、今回ではComposerというGKEのマネージドサービスを使っています。これの中身、具体的な仕組みは置いておいて、流れをご紹介します。 まずBigQueryから、本日今時点で有効になっている、使える、発売になっている商品情報をダーッと取ってきます。だいたいこれが300万画像ぐらい。その日によって違っ

                  ビッグデータ活用時のワークフローの大切さ ZOZO研究所のエンジニアが感じた次元が違う300万画像の処理
                • 業務未経験で駆け出したエンジニアの5年後 〜目標管理の変遷と個人OKR〜

                  概要 状況変化が激しい環境で、向き合うべき課題と方向性を適切に定め、素早く成長していくためには「技術の学び方を学ぶことへの投資や管理」が不可欠 経営管理手法の1つであるOKRを個人の目標管理に適用することはとても有意義 個人でOKRをやる上ではフィードバックのもらい方や振り返りを工夫しない限り効果が半減してしまう Microsoft Ignite The Tour 2019 Tokyoでの登壇 12月5、6日に開催された東京でのMicrosoft Ignite The Tour 2019で個人OKRで加速させる技術力向上というタイトルで登壇しました。自分が45分間もOKRの話をするなんて夢にも思っておらず、後述する個人OKRにも含めているものでもなかったので依頼いただいたときには少し迷いました。しかし、つぎの理由から挑戦してみることにしました。 定期的に目標管理手法を見直し、改善していくこ

                    業務未経験で駆け出したエンジニアの5年後 〜目標管理の変遷と個人OKR〜
                  • お知らせ: Google Cloud の Buildpacks でコンテナ イメージ作成が簡単に | Google Cloud 公式ブログ

                    ※この投稿は米国時間 2020 年 10 月 10 日に、Google Cloud blog に投稿されたものの抄訳です。 新しいアプリケーションを構築する開発者が集中して取り組むべきなのは、コードの記述であって、コンテナ化ではありません。また、すでにコンテナを使用している開発者であれば、適切で安全なコンテナ イメージの作成がどれだけ複雑で時間のかかる作業かということをご存じでしょう。そこで本日、安全かつ本番環境ですぐに使えるコンテナ イメージを、Dockerfile がなくてもソースコードからすばやく簡単に作成できるオープンソースのテクノロジー、Buildpacks を Google Cloud 全体で幅広くサポートする体制が整いましたことをお知らせいたします。 このリリースの目玉は、なんといってもオープンソースの Buildpacks とビルダーです。CNCF の Buildpacks

                      お知らせ: Google Cloud の Buildpacks でコンテナ イメージ作成が簡単に | Google Cloud 公式ブログ
                    • Google Cloud の API Gateway を眺めてみる

                      はじめに2020 年の 9 月に全世界待望 (?) の API Gateway のベータ版がリリースされました。このサービスにより、Google Cloud のサーバーレス系サービスをバックエンドにした API をより簡単に作成・管理することができるようになりました。 ところで、元々 Google Cloud には Apigee や Cloud Endpoints といった API 系サービスがありました。今回の API Gateway はそれらとどのように違うのでしょうか? 本記事では新しく Google Cloud の仲間に加わった API Gateway の立ち位置を整理し、実際に API Gateway を試してみたいと思います。 Apigee と Cloud Endpoints おさらいApigeeApigee はエンタープライズ向けの API 管理プラットフォームです。以下のよ

                        Google Cloud の API Gateway を眺めてみる
                      • Bringing eBPF and Cilium to Google Kubernetes Engine | Google Cloud Blog

                        New GKE Dataplane V2 increases security and visibility for containers Editor’s note: As of May 10, 2021, GKE Dataplane V2 is generally available starting with GKE version 1.20.6-gke.700. We’re also using Dataplane V2 to make Kubernetes Network Policy logging generally available on Google Kubernetes Engine (GKE). One of Kubernetes’ true superpowers is its developer-first networking model. It provid

                          Bringing eBPF and Cilium to Google Kubernetes Engine | Google Cloud Blog
                        • Goで作ったシステムのパフォーマンス改善ポイント 2万rpsを処理する行動ログ収集システム構築から学ぶ

                          「DMM.go」は、DMM GroupにおけるGoの勉強会です。2回目の今回は、DMM.com プラットフォーム事業本部の潮平諒也氏が、オンプレで作っていたシステムをクラウド化し、Goでシステムを構築した自らの経験を基に、パフォーマンス向上のポイントについて紹介しました。 2万rpsを処理する行動ログ収集システムをGoで作った話 潮平諒也氏:「2万rpsを処理する行動ログ収集システムをGoで作った話」と題して、発表いたします。 まず自己紹介からですね。潮平諒也と申します。現在はデータインフラ部のデータエンジニアチームで仕事しています。 高専を卒業して、去年度19新卒としてDMMに入社しました。入社したときは、全然Goの経験とかなくて、研修で触り始めて、Go歴が9ヶ月ぐらいという感じです。 今日は、今いるチームに配属されて今年の3月まで携わった「行動ログ収集システムのクラウド移行プロジェクト

                            Goで作ったシステムのパフォーマンス改善ポイント 2万rpsを処理する行動ログ収集システム構築から学ぶ
                          • Professional Cloud Architect試験対策マニュアル - G-gen Tech Blog

                            G-gen の杉村です。 Professional Cloud Architect 試験 は、 Associate Cloud Engineer 試験の上位に位置する Google Cloud (旧称 GCP) の難関認定資格です。本投稿では試験の合格に役立つ、勉強方法や出題傾向などについて解説します。 はじめに Professional Cloud Architect 試験 とは Professional Cloud Architect 試験の難易度 推奨の勉強法 ケーススタディ 出題傾向 組織 / IAM 組織のポリシー IAM の基本概念 オペレーションスイート Cloud Monitoring Cloud Logging セキュリティ・統制 Network Intelligence Center Data Loss Prevention Kubernetes / Google Ku

                              Professional Cloud Architect試験対策マニュアル - G-gen Tech Blog
                            • GKE に飛んでくるトラフィックを 自由自在に操る力 | 第 10 回 Google Cloud INSIDE Games & Apps Online

                              2020 年 4 月 27 日(月) 第 10 回 Google Cloud INSIDE Games & Apps Online Google Cloud 篠原 一徳によるセッション スライドです。Read less

                                GKE に飛んでくるトラフィックを 自由自在に操る力 | 第 10 回 Google Cloud INSIDE Games & Apps Online
                              • メルペイのエンジニアが考えるOpen Policy AgentとSpinnakerで実現するマイクロサービスの安全な継続的デリバリー

                                KubeFest Tokyo 2020は、Kubernetes を利用している人、これから導入したい人が新しいことを学んだり、ネットワーキングすることを狙いとして開催するワンデイのオンラインイベントです。Kubernetes環境におけるCI/CDの問題をOpen Policy AgentとSpinnakerを導入することで解決する方法について、メルペイの山下氏が話をしました。後半はOpen Policy AgentとSpinnakerの導入について。 Open Policy Agentとは Open Policy Agentについて軽く説明したいと思います。Open Policy AgentはOSSの汎用ポリシーエンジンです。Regoというポリシー記述言語によってポリシーを定義して入力データを検証します。よくあるユースケースとしては、Deploymentに特定のLabelがあることを強制し

                                  メルペイのエンジニアが考えるOpen Policy AgentとSpinnakerで実現するマイクロサービスの安全な継続的デリバリー
                                • 負荷試験#基本リンク集 | 外道父の匠

                                  前の記事は実は前フリで、最近、負荷試験について深く潜り込んだので、自分なりに考えたことを細かく分けて書いていこうと思います。負荷試験シリーズのはじまり:-) 後半はほとんど自分で考えて色々実装しましたが、序盤は先人の知恵をかき集めてイィトコ取りしたので、メモっておいたリンク集を置いておきます。 はじめに 負荷試験ってツールを選んで大量リクエストを発生させるんでしょ。ってイメージがあるかもですが、より効率的により正確にって仕上げていくと、独自に実装したい仕組みが結構でてきます。 アプリケーションは当然モノによって仕組みや構成は異なるし、プロトコルが異なる場合もあります。千差万別は言いすぎかもだけど試験には色んな選択や工夫があり、これが正解っていう単純なものではないのは間違いないです。 とはいえ、シンプルな実行と結果でも、複雑な取り組みをしたとしても、求められる成果に対して十分で正しい結果を示

                                    負荷試験#基本リンク集 | 外道父の匠
                                  • Knative-based Cloud Run services are GA | Google Cloud Blog

                                    Oren TeichDirector of Product Management, Google Cloud We want to empower developers no matter where their businesses are in their cloud journey, whether that's on-prem, operating in a managed Kubernetes environment, or running on a fully managed serverless computing platform. Today, we're announcing that Cloud Run is generally available, helping developers focus on writing high-value code, regard

                                      Knative-based Cloud Run services are GA | Google Cloud Blog
                                    • Introducing container image streaming in GKE | Google Cloud Blog

                                      Introducing GKE image streaming for fast application startup and autoscaling We’re excited to announce the general availability of a new feature in Google Kubernetes Engine (GKE): image streaming. This revolutionary GKE feature has the potential to drastically improve your application scale-up time, allowing you to respond to increased user demand more rapidly, and save money by provisioning less

                                        Introducing container image streaming in GKE | Google Cloud Blog
                                      • Nota Tech Conf 2022 Springを開催しました #notatech2022 - Helpfeel Developers' Blog

                                        2022年5月17日〜19日にNota Tech Conf 2022 Springを開催しました。諸般の事情で当初予定していた開催スケジュール変更をさせて頂きましたが、多くの皆さんにご参加・ご視聴頂きありがとうございました。 この開催報告エントリーでは改めて3日間の演目とアーカイブ動画・資料などを紹介します。 Nota Tech Conf 2022 Springについて Day 1 Notaのプロダクトビジョンと事業成長(CEO 洛西一周) グラデーションを許容するフロントエンド(ツール)生存戦略(Pasta-K) Gyazo と GKE(hiroshi) 管理画面のボタンを安心して押してもらうためにやったこと(hata) 関連ページリストが広がってきた(shokai) トークセッション: CTO&PMPO対談(増井俊之 / yuiseki / daiiz / shokai) Day 2

                                          Nota Tech Conf 2022 Springを開催しました #notatech2022 - Helpfeel Developers' Blog
                                        • ChatworkのKubernetesを支えるツールたち(2020年版) - kubell Creator's Note

                                          こんにちは。SRE部坂本です。毎年最低1回はフルマラソンに出ていますが、2020年はあえなく参加できずに終わりました。 2月にギリギリ行われたハーフマラソンではなんとか90分切り(89分台)を達成し、今年は3時間10分以内を目指してただけに残念ですが、仕方ありません。 特に部活等で走っていたわけでもなく、トラックの大会に参加するのはやや抵抗があり、年間の走行距離ぐらいしか目標がなく、これを書いている12月中旬で2591kmとなっています。昨年が2724kmだったので、なんとか更新したいなーというのが今の気持ちです。 さて、Chatworkでは2016年からKubernetesを導入しております。EKSもない時代ですので、kube-awsというツールを利用してEC2にホスティングして運用していましたが、今年EKSに移行しました。 aws.amazon.com そんなChatworkのKube

                                            ChatworkのKubernetesを支えるツールたち(2020年版) - kubell Creator's Note
                                          • どこで実行すべきか。Google Cloud のコンピューティング オプションの選択 | Google Cloud 公式ブログ

                                            ※この投稿は米国時間 2021 年 7 月 20 日に、Google Cloud blog に投稿されたものの抄訳です。 どこでワークロードを実行すべきでしょうか。アプリケーション自体にとっても、そのアプリケーションの管理と開発を行うチームにとっても、実行するアプリケーションに適したインフラストラクチャ オプションを選択することが重要です。この投稿では、実行場所を決定するときに検討する必要がある特に重要な要素をいくつか取り上げて説明します。 サービスについてCompute Engine - 仮想マシン。CPU、メモリ、ディスク、GPU の構成を予約して、実行する OS と追加ソフトウェアを決めます。 Kubernetes Engine - マネージド Kubernetes クラスタ。Kubernetes は、コンテナ化アプリケーションのデプロイ、スケーリング、管理を自動化するオープンソース

                                              どこで実行すべきか。Google Cloud のコンピューティング オプションの選択 | Google Cloud 公式ブログ
                                            • 「Kubernetes で構築する PHP 開発環境」を発表しました - Shin x Blog

                                              2019/12/01 に東京で行われた PHP Conference Japan 2019 - #phpcon にて、「Kubernetes で構築する PHP 開発環境」を発表してきました。 発表資料 サンプルコード: https://github.com/shin1x1/laravel-k8s-dev-sample Togetter: https://togetter.com/li/1438089 Kubernetes を使って、PHP 開発環境を構築するという内容でした。デモでは、Mac に構築した Kubernetes クラスタを紹介して、Mac にあるソースコードを変更すると、Kubernetes クラスタ内で実行している PHP Pod で読み込めるということを紹介しました。PHP 開発では重要なことですね。 開発環境に特化した内容なので、本番等で使うときはまた違う点があります

                                                「Kubernetes で構築する PHP 開発環境」を発表しました - Shin x Blog
                                              • AI・機械学習チーム最強MR(Merge Request)決定戦2023 - エムスリーテックブログ

                                                AI・機械学習チームの(中村@po3rin)です。 今年もこの季節がやってきました。エムスリーAI・機械学習チームの最強MR決定戦のお時間です。 MRとはMerge Requestの略称です。 GitHubでいうところのPR (Pull Request) にあたります。 この記事ではAI・機械学習チームが毎年恒例で行なっているベストMRのトップ10について発表します。 このベストMRはチーム内でこれは最高だった!というMRをノミネートしていき、その中で決選投票をしてベスト10を決めました。 今年も熾烈な闘いを勝ち上がった至極のMRがノミネートされました。 では、10位からご覧ください。と、言いたいところですが、今年は同票のため11位から紹介します。 このブログの内容は、投票した人の中から紹介者を決めて、実装者のやったMRを紹介するスタイルで書かれました。 第11位 CronJobの監視シー

                                                  AI・機械学習チーム最強MR(Merge Request)決定戦2023 - エムスリーテックブログ
                                                • Kubernetes上のコンテナをIngressでインターネットに公開するまで

                                                  はじめに 前回はKubernetesクラスタを構築してコンテナを起動し、ノードからアクセスできるところまで解説しましたが、クラスタが動くようになったとはいえ、まだ単にコンテナを起動しただけに過ぎません。 そこで今回は、起動したコンテナを複数にスケーリングして通信を分散させた上で、クラスタ外部からアクセスできるようにします。これで、耐障害性を確保しながらインターネット上にコンテナを公開できるようになります。 なお、今回は、Kubernetesクラスタ内に下図を構成します。1つずつ見ていきましょう。 Podを複数配備するDeployment KubernetesではPodを作成することでコンテナを起動しますが、単一のPodを起動するだけでは耐障害性やスケーリングなど、Kubernetesの恩恵を受けることができません。もしPodが起動しているノードに障害が発生したらPodも同時に停止してしまい

                                                    Kubernetes上のコンテナをIngressでインターネットに公開するまで
                                                  • Cloud Spannerを使う大規模アプリケーションの負荷試験におけるアプローチとチューニング | BLOG - DeNA Engineering

                                                    2024.05.14 技術記事 Cloud Spannerを使う大規模アプリケーションの負荷試験におけるアプローチとチューニング by tomohiro.katsukura #loadtest #google-cloud #spanner ゲームサービス事業本部の勝倉です。 この投稿では、Cloud Spanner を使う大規模アプリケーション 1 での負荷試験の方法論と、チューニング方法について記述しています。 前半は、従来的な負荷試験の手法が抱える課題を整理し、それらを解決する新しい方法論を紹介しています。 後半は、Cloud Spanner で秒間500万超のクエリ(5M+ QPS)の負荷を捌くまでに出てきたボトルネックの見つけ方と潰し方について紹介しています。 1. 負荷試験の悩みどころ バックエンドアプリケーションの開発において、負荷試験は重要なチェックポイントになります。 これ

                                                      Cloud Spannerを使う大規模アプリケーションの負荷試験におけるアプローチとチューニング | BLOG - DeNA Engineering
                                                    • [レポート] 冗長化、永続化、ログ… Prometheus を拡張するエコシステムについて Meetup で聞いてきた #prometheustokyo | DevelopersIO

                                                      はじめに 1/15、今回で 3 回目となる Prometheus Meetup Tokyo が開催されたため参加してきました。 今回のテーマは「Prometheus を取り巻くエコシステム達」ということで、Thanos や Victoria Metrics、Grafana Loki など、Prometheus の機能を拡張するソリューションやその事例について熱いプレゼンテーションが行われました。 会場は東京・田町駅から徒歩圏内にある、 NTT ソフトウェアイノベーションセンタさまのイベントスペースでした。こちらの会場は OSS に関する非営利イベントであれば貸し出せるとのことです。 「Prometheus Meetup Tokyo」の会場準備完了!あとはみなさんが来るのを待つだけ!今日は、Prometheus のエコシステム回なので楽しみ?https://t.co/M8WOgemcRO #

                                                        [レポート] 冗長化、永続化、ログ… Prometheus を拡張するエコシステムについて Meetup で聞いてきた #prometheustokyo | DevelopersIO
                                                      • Anthosの話についていくための最低限の知識をまとめてみた | フューチャー技術ブログ

                                                        はじめにこんにちは、TIGの越島と申します。 GCP連載2021第9弾です。今回技術ブログに初参加させていただきます。テーマはAnthosです。 Anthosは2019年にGoogleが発表した、「ハイブリッドクラウド・マルチクラウド環境に対応したアプリケーション管理プラットフォーム」です。発表から2年ほど経って、エンタープライズ向けのシステム構成を検討する際に名前が挙がることも増えてきている実感があります。そんなAnthosですが、構成要素が多くて中々全体像が掴みきれない人も多いのではないかと思います。 今回は、「Anthosって何だかよく分からん」という人が、Anthosの話題についていくための最低限の知識をまとめてみようと思います。この記事を読んだ方が、次どこかでAnthosの話題が出たときに、「あ〜はいはいAnthosね」とある程度自信を持って言えるようになることを目指しています。

                                                          Anthosの話についていくための最低限の知識をまとめてみた | フューチャー技術ブログ
                                                        • Kubernetes クラスタ内の別ノード再起動によるTCP接続タイムアウト

                                                          はじめに GKE クラスタを運用中に、WebSocket の接続が定期的に同時に 4000 近く送信タイムアウトが発生して切断される、という障害に遭遇しました。クライアントからみると WebSocket の再接続をすれば済むと思うかもしれませんが、この切断は TCP 経路中のネットワーク遮断によるものなので、これを通信の両端が検知するまでにはどうやっても時間がかかるため、その間の WebSocket 経由のメッセージのやり取りに支障が発生することは避けられません。また、WebSocket 接続の終了処理リクエストとその後の再接続に伴う確立処理リクエストのスパイクは予期せぬバックエンドの負荷につながります。 障害の原因は特定して コンテナ ネイティブの負荷分散に切り替えることで解消されました。このエントリーでは、障害の発生条件・原因・対応策を簡単にまとめます。GKE に限定して書きますがそれ

                                                            Kubernetes クラスタ内の別ノード再起動によるTCP接続タイムアウト
                                                          • GKEクラスターのバージョン管理を便利にする自動アップグレードの戦略 - Qiita

                                                            はじめに GKE(Google Kubernetes Engine)には、クラスタの自動アップグレード機能があります。Kubernetesにおけるマスターのバージョン管理をGoogleに任せることができる機能で、これを使うことで自分たちでクラスターの中身を入れ替える必要がなくなるため、運用コストの削減につながります。NodeのmaxSurge/maxUnavailableと組み合わせるとほぼ全自動でクラスタのバージョン入れ替えが終わりますね!なお、この機能はデフォルトで有効化されており、無効にすることはできません。 Ref: https://cloud.google.com/kubernetes-engine/docs/concepts/cluster-upgrades 今回は、この自動アップグレードにおいて注意すべきポイントや、どのような設定ができるかを見ていきます。 公式ドキュメントが

                                                              GKEクラスターのバージョン管理を便利にする自動アップグレードの戦略 - Qiita
                                                            • Ciliumのkube-proxy置き換えをGKEで試してみた | GRIPHONE ENGINEER'S BLOG

                                                              SREの徳田です。 今回はCiliumのv1.7からGAになったKubernetes without kube-proxyのタイトルで出てる、Ciliumによるkube-proxyの置き換えの機能をGKE上で試してみようと思います。 Ciliumとは こちら の記事の後半を見てみると若干書いてあります😌 要はBPFを使いこなし、Blazing Performanceで処理するぞ💪というProductです。 概要についてはこの記事からそれるのでリンクだけおいておきます。 https://cilium.io/ クラスタの準備 それではGKEのクラスタの準備をしましょう。 google-cloud-sdk とGCPに対しての認証とプロジェクトの指定は終わらせているものとします。 CLUSTER_NAME=cilium-cluster CLUSTER_ZONE=asia-northeast1-

                                                                Ciliumのkube-proxy置き換えをGKEで試してみた | GRIPHONE ENGINEER'S BLOG
                                                              • Why I think GCP is better than AWS

                                                                I originally posted this on Reddit so I could get a good sample of opinions from other engineers to see how they compared to mine before posting and expanding here. This is my opinion based on my experience with both platforms (two years in each). My bias towards GCP is mostly based on the superior experience I have gotten with it and I am in no way affiliated with Google. AWS is still my second c

                                                                  Why I think GCP is better than AWS
                                                                • Google Cloud で実行されている DevOps 組織の有効性を評価する | Google Cloud 公式ブログ

                                                                  ※この投稿は米国時間 2020 年 10 月 3 日に、Google Cloud blog に投稿されたものの抄訳です。 編集者注: DevOps の有効性を評価する方法は多数あります。Google Cloud デベロッパー プログラム エンジニアである Dina Graves Portman が最近、Four Keys オープンソース プロジェクトを使用して DevOps の有効性を評価する方法に関する記事を投稿しました。ここでは、Google カスタマー エンジニアである Brian Kaufman が、完全に Google Cloud 上で実行されているアプリケーションでも同じように有効性を測定する方法について説明します。 多くの組織が真に高度な DevOps ショップになることを目指していますが、自身の現在の立ち位置を把握するのは時として難しい場合があります。DevOps Rese

                                                                    Google Cloud で実行されている DevOps 組織の有効性を評価する | Google Cloud 公式ブログ
                                                                  • Kubernetes とGCPの世界をつなぐアクセス管理のはなし

                                                                    この記事は Google Cloud Japan Customer Engineer Advent Calendar 2019 の 1日目の記事です。 TL;DR Google Cloud Platform (GCP) から Kubernetes(k8s) のリソースにアクセスするための仕組みであるRole-based access control (RBAC)と、Kubernetes から GCP のリソースにアクセスするための仕組みである Workload Identity について解説しています。 はじめにGoogle Kubernetes Engine (GKE) 上で Kubernetes (k8s) の運用をご検討頂いている方向けに、K8SとGCPの世界をつなぐアクセス管理について基礎となる点をこの記事ではご紹介したいと思います。 GKE は Google Cloud Plat

                                                                      Kubernetes とGCPの世界をつなぐアクセス管理のはなし
                                                                    • Kubernetes Engine で動作するアプリでのロギングの使用 | Google Cloud 公式ブログ

                                                                      ※この投稿は米国時間 2020 年 5 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。 アプリケーションのデバッグを行うデベロッパーにとっても、また複数の本番環境クラスタにわたってアプリケーションをモニタリングする DevOps チームのメンバーにとっても、ログは IT 組織の生命線といえます。Google Kubernetes Engine(GKE)を導入している場合、Cloud Logging を使用できます。これは、GKE に統合されているさまざまなサービスの一つで、有用な情報の検索に使用できます。 Cloud Logging とそれに付随するツールの Cloud Monitoring は、双方とも GKE に密接に統合されたフル機能のプロダクトです。このブログ投稿では、GKE でロギングが機能する仕組みとログ収集のベスト プラクティスをご紹介します

                                                                        Kubernetes Engine で動作するアプリでのロギングの使用 | Google Cloud 公式ブログ
                                                                      • 週刊Railsウォッチ(20191204後編)Rubyコードをトランスパイルするruby-next、Cloud Run正式リリース、2019年Web年鑑レポート、V言語ほか|TechRacho by BPS株式会社

                                                                        2019.12.04 週刊Railsウォッチ(20191204後編)Rubyコードをトランスパイルするruby-next、Cloud Run正式リリース、2019年Web年鑑レポート、V言語ほか こんにちは、hachi8833です。1日遅れの後編です🙇。 各記事冒頭には⚓でパーマリンクを置いてあります: 社内やTwitterでの議論などにどうぞ 「つっつきボイス」はRailsウォッチ公開前ドラフトを(鍋のように)社内有志でつっついたときの会話の再構成です👄 毎月第一木曜日に「公開つっつき会」を開催しています: お気軽にご応募ください ⚓お知らせ: 週刊Railsウォッチ「第17回公開つっつき会」(無料) お申し込み: 週刊Railsウォッチ公開つっつき会 第17回|IT勉強会ならTECH PLAY[テックプレイ] 第16回目公開つっつき会は、明日12月05日(木)19:30〜にBPS会

                                                                          週刊Railsウォッチ(20191204後編)Rubyコードをトランスパイルするruby-next、Cloud Run正式リリース、2019年Web年鑑レポート、V言語ほか|TechRacho by BPS株式会社
                                                                        • Kubernetesの動向予測 2019 => 2020 | gihyo.jp

                                                                          あけましておめでとうございます。サイバーエージェントの青山真也(@amsy810)です。昨年は国内最大のCloudNativeカンファレンスCloudNative Days Tokyo 2019のCo-chairを務めさせていたただいたり、かれこれ7回目のKubeCon + CloudNativeConに参加したりと、CloudNativeやKubernetes漬けでした。新春企画ということで、今回はトピックをいくつかに絞ってKubernetes関連の2019年のまとめと今年の予測を少ししてみます。 Kubernetes最新動向 Kubernetesには機能追加をコミュニティに提案するKubernetes Enhanced Proposals(KEPs)と呼ばれる仕組みがあります。Kubernetesのプロダクション利用が進むにつれ、KEPsの提案や実装が進み、Kubernetes本体に対

                                                                            Kubernetesの動向予測 2019 => 2020 | gihyo.jp
                                                                          • Elasticsearchで個人ごとに検索結果を表示するには? ZOZOTOWNを支える検索パーソナライズ基盤アーキテクチャ

                                                                            ZOZO Technologies Meetup は、「ZOZOテクノロジーズの大規模データ活用に興味のある方」を対象としたイベントです。ZOZOTOWNの検索パーソナライズプロジェクトのアーキテクチャ設計から運用まで、MLOpsチームの児玉氏が苦労したポイントなどを話しました。最新資料はこちら。 アジェンダと自己紹介 児玉悠氏(以下、児玉):みなさんお疲れさまです。自分は「ZOZOTOWNを支える検索パーソナライズ基盤」というタイトルで発表いたします。 本日のアジェンダは、まずZOZOTOWNの検索パーソナライズのプロジェクトの概要について説明します。そのあとにプロジェクトの組織体制について話して、アーキテクチャの話に入っていきます。そのアーキテクチャの設計の話で、リリース前の検証段階でいくつか変更ポイントがあったので、それについても説明します。最後に、今使っているElastic Clo

                                                                              Elasticsearchで個人ごとに検索結果を表示するには? ZOZOTOWNを支える検索パーソナライズ基盤アーキテクチャ
                                                                            • SmartHR:Google Cloud へのフル マイグレーションを敢行し、モダンなサーバーレス環境を構築 | Google Cloud 公式ブログ

                                                                              SmartHR:Google Cloud へのフル マイグレーションを敢行し、モダンなサーバーレス環境を構築 クラウド人事労務ソフト『SmartHR』で労務管理クラウド 4 年連続シェア No.1(※)を誇る株式会社SmartHR(以下、SmartHR)。国内有数のユニコーン企業としても知られる同社が、『SmartHR』のクラウド プラットフォームを Google Cloud へと全面移行しました。そこにどんな事情と課題があったのか、移行によってどのような価値を生み出したのか。この移行を舵取りした全社Ops クラウド基盤ユニット 藤村 宗彦氏に話を伺いました。 ※ デロイト トーマツ ミック経済研究所「HRTechクラウド市場の実態と展望 2021年度」 利用しているサービス: Cloud Run、App Engine、Cloud Storage、Cloud SQL、Memorystore

                                                                                SmartHR:Google Cloud へのフル マイグレーションを敢行し、モダンなサーバーレス環境を構築 | Google Cloud 公式ブログ
                                                                              • KubeCon NA 2019(Day1) 参加メモ - Qiita

                                                                                自分用参加・聴講メモ ※Keynoteは省略 Kubernetes at Cruise: Two Years of Multitenancy 資料公開なし Cruiseは自動運転の会社 Cluster: 12-26 64or32vCPUで1,000node (セッション情報では100,000Pod, 4000Nodeとあったけど、間違ってそう...) Multitenancyは論理的に隔離されているが、物理的には統合されている CruiseはK8sのNamespaceで論理的に隔離している クラスタ数を少なくすることで、Costを減らす狙いがあった 秘密情報の管理にVaultを使っている ClientであるDAYTONAをinitContainerで使っている また、k-railという、Cruiseで作ったOSSでWorkloadのPolicyを管理している Team単位でNamespac

                                                                                  KubeCon NA 2019(Day1) 参加メモ - Qiita
                                                                                • Cloud Profilerを導入してパフォーマンス改善をした話

                                                                                  こんにちは! Magic Momentでテックリードをしている Miyake です。 弊社が開発するセールスエンゲージメントプラットフォームである Magic Moment Playbook では営業活動にかかせないツールとの連携を多数を行っており、私が所属するData IntegrationチームではSalesforceなどのCRMツールを中心とした外部連携機能の開発をしています。 ただいまエンタープライズ企業のお客様が続々と増えており、取り扱うデータ規模が増大中です。それに応じて負荷対策や取り込み速度の性能改善などといったパフォーマンス改善に注力しておりまして、その過程で Cloud Profiler を利用したパフォーマンス改善の取り組みを行ったので、その内容をシェアしたいと思います。 Cloud Profiler とは Google Cloudマネージドなプロファイリングツールです

                                                                                    Cloud Profilerを導入してパフォーマンス改善をした話