並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 1367件

新着順 人気順

DataDogの検索結果321 - 360 件 / 1367件

  • データパッチ環境と有事の際のログイン環境をサーバレス化・コンテナ化した取り組み - ANDPAD Tech Blog

    1. はじめに こんにちは、SWEのあかりです。 今回のテーマは、SRE NEXT 2023のCall For Proposals(CFP) に応募したものの、残念ながら不採択になってしまったものです。話せるネタとしてはまとまっていたので、テックブログとしてここに捧げます😇 2. 本記事の概要 社内で最も古くから稼働している施工管理アプリでは、主にデータ修正と有事の際のログイン環境として開発者向けのEC2インスタンス(以降、「バッチサーバ」と表現)が存在していました。この記事では、このバッチサーバの廃止1を目的として、このサーバが担っていた役割をサーバレス環境・コンテナ環境へ移行し、EC2インスタンスからの脱却を達成した取り組み2について説明します。 この記事を読んで得られることは以下の通りです。 EC2インスタンスを廃止する取り組みの流れ 技術選定時に定性分析を行う事例 本番データを修

      データパッチ環境と有事の際のログイン環境をサーバレス化・コンテナ化した取り組み - ANDPAD Tech Blog
    • メルカリの取引ドメインにおけるモジュラーモノリス化の取り組み | メルカリエンジニアリング

      この記事は「連載:連載:技術基盤強化プロジェクト「RFS」の現在と未来」として書かれたものです。 メルカリのトランザクションチームでバックエンドエンジニアをしている @adachang です。今回は前回の記事に引き続き、メルカリの取引ドメインに属するコードベースのメンテナンス性・拡張性を改善するための取り組みを紹介します。 前回の記事では、この取り組みの背景や課題、ドメイン分析や依存関係をデカップリングするアプローチについて説明しました。その中でメルカリの “取引” を扱う大きなドメインを、商品代金の支払いとそれ以降のプロセスに分割し、前者を「Checkout ドメイン」、後者を 「Transaction ドメイン」と呼ぶことにしました。この記事では、Transactionのドメインを取り上げ、PHPのモノリスをモジュラーモノリスに移行するための現在進行中の取り組みをご紹介します。私たちが

        メルカリの取引ドメインにおけるモジュラーモノリス化の取り組み | メルカリエンジニアリング
      • タイミーのEMとしてどのようにマネジメントしているか - Sionの技術ブログ

        はじめに 16歳からゲーマーとしてずっとチームマネジメントをやっており、 自身の強みなので本腰入れてやりたいという思いで1月にタイミーに入社しました。 結果、今はSREマネージャー(2人) + BI基盤チームマネージャー(3人) + コーポレートエンジニア(3人)として働いてます。 そんなにメンバーはいませんがマネージャーはやれてると思ってるので、色々と書いてみたいと思います。 そんなに掛け持ちして大丈夫なの? スタートアップは仕方ないです。ぜひ強い方募集してます。 自分の脳内の長期計画は全てアウトプットしてチームと精査してるので出来る人がやればいい状態です。 私自身マネジメントしながら、業務でコードも書いてレビューもしてるので、自身の時間を作るために自走できるチームを作り上げるためのマネジメントでもあります。 マネージャーとしてどういう動きしてるの? - ローテーション可能のものとする

          タイミーのEMとしてどのようにマネジメントしているか - Sionの技術ブログ
        • gRPC Development Environment - Wantedly の gRPC Server/Client 開発環境 | Wantedly Engineer Blog

          こんにちは、Wantedly の Infrastructure Team で Engineer をしている南(@south37)です。 先日、gRPC 関連で2つのブログを書きました。「gRPC Internal」では、ドキュメントやコードを読み解くなかで見えてきた「gRPC の設計と内部実装」についてブログを書きました。「Real World Performance of gRPC」では、Wantedly で実際に gRPC を利用することで達成できたパフォーマンス改善についてブログを書きました。 こんにちは、Wantedly の Infrastructure Team で Engineer をしている南(@south37 )です。 今日は、WANTEDLY TECH BOOK 6 から「gRPC Internal」という章を抜粋して Blog にします。 「WANTEDLY TECH

            gRPC Development Environment - Wantedly の gRPC Server/Client 開発環境 | Wantedly Engineer Blog
          • Fastlyのパスベースルーティングで実現するWEARのゆるやかなクラウド移行 - ZOZO TECH BLOG

            はじめに こんにちは。メディアプラットフォーム本部 WEAR部 WEAR-SREの長尾です。 WEARは2013年にリリースされ、現在8年目のサービスです。そして、2004年にリリースされた当時のZOZOTOWNと同じアーキテクチャを採用しているため、比較的古いシステム構成で稼働しています。本記事では、そのWEARのWebアプリケーション刷新とクラウド移行で実践している、Fastlyを活用したパスベースルーティングによる段階移行の取り組みを紹介します。 WEARをリプレイスする理由 WEARのWebアプリケーションは、データセンターでオンプレミス(以下、オンプレ)上で稼働しています。また、DBはSQL Serverを利用しています。長年このアーキテクチャで成長を続けてきましたが、今後さらに成長を加速させていくためには以下の3点を実現する必要があります。その実現に向け、2年前からリプレイスに

              Fastlyのパスベースルーティングで実現するWEARのゆるやかなクラウド移行 - ZOZO TECH BLOG
            • 「Pulumi AI」発表 自然言語でAWS、Azure、Cloudflare、Kubernetes、Datadogなど130以上のインフラやサービスのInfra-as-Codeを自動生成

              この記事は新野淳一氏のブログ「Publickey」に掲載された「「Pulumi AI」発表。自然言語でAWS、Azure、Cloudflare、Kubernetes、Datadogなど130以上のインフラやサービスのInfra-as-Codeを自動生成」(2023年4月17日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。 クラウドをはじめとするITインフラの構成をコードで定義する、いわゆる「Infrastructure as Code」ツール「Pulumi」を提供するPulumi社は、自然言語からインフラ構成コードを自動生成する「Pulumi AI」を含む、AIを活用した新サービス群「Pulumi Insights」を発表しました。 PulumiはTypeScriptやPython、Go、Javaといった一般的なプログラミング言語を使ってインフラの構成コードを記述

                「Pulumi AI」発表 自然言語でAWS、Azure、Cloudflare、Kubernetes、Datadogなど130以上のインフラやサービスのInfra-as-Codeを自動生成
              • スタディサプリにおけるKarpenterの導入トラブル振り返り - スタディサプリ Product Team Blog

                スタディサプリにおけるKarpenterの導入トラブル振り返り こんにちは。スタディサプリ小中高SREの@aoi1です。 スタディサプリでは、Kubernetesを利用しているのですが、Nodeの運用自動化のために2023年3月から本番環境を含む全環境でKarpenterを導入しています。 Karpenterのおかげで開発者体験を向上させることができたり、コスト削減を行うことができました。便利で良いことが沢山ある一方、本番環境で問題が発生するなどいくつかハマったこともありました。 本ブログでは私たちがハマったポイントを通じて、Karpenterの導入を検討している方、あるいは既に本番環境でKarpenterを運用している方にとって参考になればと思います。 Karpenterとは KarpenterはAmazon Web Sevice(AWS)が開発しているOSSで、「Karpenter s

                  スタディサプリにおけるKarpenterの導入トラブル振り返り - スタディサプリ Product Team Blog
                • 新任エンジニアリングマネージャーが新規事業で果たした役割と今考えていること - KAKEHASHI Tech Blog

                  はじめに こんにちは!エンジニアリングマネージャーの小田中(@dora_e_m)です。 この記事はカケハシ Advent Calendar 2023 の 12日目の記事になります。 https://adventar.org/calendars/8587 今年はPart2もあるのでぜひそちらもご覧ください! https://adventar.org/calendars/8728 この記事ではタイトルのとおり、新規事業のプロダクト開発チームにおいて新任のエンジニアリングマネージャー(以下、EM)がどのような役割を担うのか、私自身の実体験をもとに紐解いていきます。 前提: カケハシに存在するEM、開発ディレクターというロール カケハシにはEMに加え、開発ディレクターというロールがあります。カケハシでは基本的にどのチームでもスクラムを採用しており、開発ディレクターはスクラムマスターとイコールで考え

                    新任エンジニアリングマネージャーが新規事業で果たした役割と今考えていること - KAKEHASHI Tech Blog
                  • 10年前、150万円で買ったNVIDIA株が4億円になった人の話→「私なら10倍くらいで手放してしまう…」

                    FabyΔ @FABYMETAL4 メタラー兼業投資家。2013年にNVIDIA $NVDA に150万円投資し10年間ガチホ中。2024年、生成AIの登場によるNVIDIA GPU需要増に伴い 150万円→4億円 (280倍) を達成。米国企業分析、決算分析、AIトレンド、特にNVIDIAに関する情報発信をしています。たまにメタル界隈にPOPします🤘 FabyΔ @FABYMETAL4 本日、ガチホ10年目のNVIDIAが150万円→4億円(280倍)を達成しました。NVIDIAには感謝の一言に尽きます。ありがとう $NVDA pic.twitter.com/WEnJm1Ks8K x.com/fabymetal4/sta… FabyΔ @FABYMETAL4 本日、保有10年目のNVIDIAが 円換算で150万円→3億円(200倍)となりました。 先日のGTCの基調講演の内容も素晴らし

                      10年前、150万円で買ったNVIDIA株が4億円になった人の話→「私なら10倍くらいで手放してしまう…」
                    • あのサービスの監視・オブザーバビリティ アーキテクチャ選定【前編】 - Findy Tools

                      公開日 2024/01/24更新日 2024/07/25あのサービスの監視・オブザーバビリティ アーキテクチャ選定【前編】 ユーザーや顧客へ信頼性を担保した価値提供をしていく中で、監視・オブザーバビリティの取り組みは非常に重要です。 今回の特集記事では、合同会社DMM.com、株式会社MIXI、株式会社マネーフォワード、パイオニア株式会社、Sansan株式会社、株式会社ZOZOの6社の各サービスを支える監視・オブザーバビリティの仕組みとして各社がどのようなアーキテクチャを組んでいるのか、またそのアーキテクチャにしている背景や意図についてお伺いしました。 自社に近いアーキテクチャやどのようにツールを活用しているかについて、実際の事例を元に参考になれば幸いです。 なお、後編も近いうちに公開させていただきますのでお楽しみに。 合同会社DMM.com(DMMブックス) アーキテクチャ設計の背景・意

                        あのサービスの監視・オブザーバビリティ アーキテクチャ選定【前編】 - Findy Tools
                      • 自宅の消費/発電電力量を記録しはじめてから1年経った - Datadog Synthetic Tests はじめの一歩 - えいのうにっき

                        こんなかんじで記録・確認できるようにしています 一昨年、PPAの制度を利用して自宅に太陽光発電を導入してそれなりに便利に活用していたのですが、唯一引っかかっていたのが、その実績値の確認や記録のこと。 我が家で利用しているシステムの場合、↓のようなWebサービスでそれを確認することができるんですが、 なんと、これだけしかみられなくって。 1時間単位でどれくらいの消費/発電量だったか 当月以前の過去の消費/発電量の推移はどんなだったか といったような情報は、このWebサービス単独では得ることができません。......つらい! ただ、"このWebサービス単独では" と書いたとおり、何らかの仕組み、もしくは努力によって以下のようなことをすることで、補うことはできます。 毎時間、このサイトにアクセスし、その時点での消費/発電量を取得(いわゆるスクレイピングですね)、前回アクセス時のそれらとの差分を取

                          自宅の消費/発電電力量を記録しはじめてから1年経った - Datadog Synthetic Tests はじめの一歩 - えいのうにっき
                        • 【Go】profefeでContinuous Profilingをやっていく話 - Mirrativ Tech Blog

                          こんにちは、サーバーエンジニアの牧野です。 今回はGoで開発しているアプリケーションでContinuous Profilingを実践するために導入した profefe を紹介したいと思います。 Continuous Profilingとは Continuous Profilingとは、ざっくり言うと本番環境で継続的にプロファイリングすることを指します。Continuous Profilingができると、本番環境でのみ発生するパフォーマンスの問題を捉えることができたり、継続的にプロファイリングすることで問題が発生する前後の状態を比較することができます。 Goには pprof というプロファイリングのための標準パッケージがあり、プロファイリング自体は容易に行うことができますが、Continuous Profilingを実現するとなると、以下のような課題と向き合う必要があります。 本番環境でオー

                            【Go】profefeでContinuous Profilingをやっていく話 - Mirrativ Tech Blog
                          • 低レイヤ領域への理解を深めながら、キャリアを開拓してきた。坂本大将の足跡

                            LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINEで働くエンジニアにいろいろと話を聞く「LINE Engineer Insights」。LINEの技術組織で働く個々人に、何を重視して技術者としてのキャリアを歩んでいるのか、今LINEで何に取り組んでいるのか、今後実現したいことなどを聞いていきます。 今回登場するのは、Observability Infrastructureチームに所属する坂本大将です。「大規模なシステムの可用性・信頼性を保ちつつ、開発・運用することに強い興味がある」と語る彼。その言葉の通り、坂本は2021年にLINEに入社して以来、プライベートクラウド「Verda」の監視基盤を担当した後、社内異動制度を利用して現在は時系列データベースの構築・運用などを

                              低レイヤ領域への理解を深めながら、キャリアを開拓してきた。坂本大将の足跡
                            • Kafkaに接続するJavaアプリケーションをGravitonインスタンスへ移行してパフォーマンスを改善する - joker1007’s diary

                              社内向けのドキュメントと兼用したので、前提とかメンバー向けの解説が含まれているので、前後のパフォーマンスの変化だけを見たい人は、下の方のグラフ画像までスクロールしてください。 gravitonインスタンスを活用するモチベーション ワークロードによる相性はあるが、特にマルチスレッド性能で既存のインスタンスより性能向上が見られる上にコストが安いため、うまくフィットすれば性能改善とコスト削減の双方でメリットがある。 また、周辺ハードウェアもアップデートされているため、エフェメラルストレージ付きのインスタンスのストレージサイズが増えているなどのメリットもある。 特に現時点ではr6gdインスタンスが利用したかった。 gravitonインスタンスを利用するためarm64アーキテクチャへの対応 gravitonインスタンスはarm64 (aarch64) アーキテクチャのCPUのため、既存のx86_64

                                Kafkaに接続するJavaアプリケーションをGravitonインスタンスへ移行してパフォーマンスを改善する - joker1007’s diary
                              • レガシーなアプリケーションの監視を改善するため最初にやったこと - DMM inside

                                |DMM inside

                                  レガシーなアプリケーションの監視を改善するため最初にやったこと - DMM inside
                                • バクラクの爆速開発を支えるDevOpsチームの「のびしろ」! #のびしろウィーク - LayerX エンジニアブログ

                                  こんにちは!バクラク事業部DevOpsチームです。 この記事は LayerXテックアドカレ2023 の37日目の記事です、前回はid:kikuchyさんが『歳末!バクラク申請・経費精算モバイルアプリ のびしろ大放出祭 』という記事を書いてくれました。また、38日目はid:suguruが『バクラク Enabling Team の課題とのびしろ #のびしろウィーク』を書いてくださいました! 今回はのびしろウィークということで、バクラクのDevOpsチームの伸びしろをお伝えできればと思います! のびしろウィークとは のびしろウィークとは、LayerXの各チームメンバーが自分たちのチームの「のびしろ」について対外的に発信する期間です! 過去の対外的な発信では社内でうまく行った事例などについては各種発信していましたが、どういう課題があってどういった方の協力を求めているかについての発信はあまり行なって

                                    バクラクの爆速開発を支えるDevOpsチームの「のびしろ」! #のびしろウィーク - LayerX エンジニアブログ
                                  • チームで運用と戦い、おいしい牛カツと出会った話 | メルカリエンジニアリング

                                    Merpay Advent Calendar 2020 の 9 日目は、バックエンドエンジニアの @sou がお送りします。 今日は少し泥臭く、この一年チームを成長させながら運用と戦ってきた話を書こうと思います。 私の所属するチームは加盟店情報の管理を担っており、その性格から運用に伴う作業が数多く発生します。 どんなプロダクトにも運用はあると思いますが、このチームが直面した運用の負荷はそのボリュームと複雑さから、私のキャリアの中でも最大と言えるものでした。 その運用に私たちがどのように立ち向かい改善を行ってきたか、みなさまの参考になれば嬉しく思います。 なぜそんなしんどい運用を頑張っているのか、メルペイでのやりがいや楽しさ、頑張った結果の美味しい牛カツと日本酒のお店に出会えた話も添えさせていただければと思います。 ここで言う運用とは、事業を進めていく上でさまざまな場面で発生する、自チーム以

                                      チームで運用と戦い、おいしい牛カツと出会った話 | メルカリエンジニアリング
                                    • 障害への不安をぶっ壊す!カオスエンジニアリングを運用しシステムとチームの耐障害性を高める - ZOZO TECH BLOG

                                      はじめに こんにちは、計測プラットフォーム開発本部SREブロックの山本です。普段はZOZOMATやZOZOGLASSなどの計測技術に関わるシステムの開発、運用に携わっています。 我々のチームは、複数サービスを運用する中で障害対応の経験不足や知見共有の難しさといった課題に直面していました。そこで、半年ほど前にカオスエンジニアリングの導入を開始しました。 本記事では、カオスエンジニアリングを一過性のものではなくチームの文化として根付かせ、継続的な改善サイクルを生み出すための導入から運用まで、我々のチームでの実践から得られた具体的な方法をお伝えします。 これからカオスエンジニアリングを始めようとしている方はもちろん、すでに導入しているものの効果的な運用に悩んでいる方の参考になれば幸いです。 目次 はじめに 目次 背景・課題 カオスエンジニアリング導入の流れ 1. 目標とKPIの設定 1.1 目標

                                        障害への不安をぶっ壊す!カオスエンジニアリングを運用しシステムとチームの耐障害性を高める - ZOZO TECH BLOG
                                      • さくらインターネットのサービスで障害 クラウドなどは復旧、ハウジングは未解決【追記あり】

                                        3月10日午前9時30分ごろ、さくらインターネットの複数サービスで相次いで障害が発生した。クラウドサービス「さくらのクラウド」などで問題が発生した他、会員向けのメニューにアクセスできない状態だった。いずれも午前10時以降順次復旧しているが、ハウジングサービスなど一部では問題が続いている。 北海道石狩市のデータセンターで問題が発生したという。影響があったのは、さくらのクラウドや会員向けのメニューに加えて「さくらのVPS」「さくらの専用サーバPHY」「さくらのIoT」などのサービス。このうち、ハウジングサービスや専有サーバなどの一部で問題が解決していない。例えば専有サーバを提供するサービスでは、一部の顧客が電源の操作やOSのインストールができない状態という。 3月11日午後に復旧 さくらインターネットは、問題が3月11日午後5時半に解決したと発表した。 関連記事 モニタリングツール「Datad

                                          さくらインターネットのサービスで障害 クラウドなどは復旧、ハウジングは未解決【追記あり】
                                        • ZLogger - .NET CoreとUnityのためのゼロアロケーション構造化ロガー

                                          Cy#の河合です。今回、.NET CoreアプリケーションとUnityのために新しく「ZLogger」というロガーを公開しました。非常に高速、かつ、以前に紹介したZStringをバックエンドに持つことにより、文字列整形時のアロケーションをなくしています。主に .NET Core 向けに開発したものですが、Unity(IL2CPPやモバイル環境を含む)でも動くように調整してあります。 GitHub – Cysharp/ZLogger 特にコンテナ化において、標準出力は重要です。例えばDatadog LogsやStackdriver Loggingは、コンテナの標準出力から直接ログを収集します。Thw Twelve-Factor App – XI. Logsの項でも、標準出力への書き出しが推奨されています。そのような中で、ローカル環境用の装飾過多なログや、低速なConsole.WriteLin

                                            ZLogger - .NET CoreとUnityのためのゼロアロケーション構造化ロガー
                                          • LAPRAS株式会社を退職する - PartyIX

                                            8月31日をもってLAPRAS株式会社を退職する.8月7日が最終出社日だった.2018年4月1日入社だったので,2年5ヶ月いたことになる. 俺が入ったときはscoutyという社名だったけど,途中でLAPRASに変わった. 辞める時点でのLAPRAS SCORE lapras.com やってたこと でかいのだと インフラリソースのterraform化 ECSからEKSに移行 Elixirでクローラー開発 とかをやっていた.SREだけど普通にアプリケーションも開発していたので,Webアプリケーションとかクローラーの機能開発等は普通にやってた.突出してこの機能を作った!というのはあんまり思い浮かばないけど. あとRundeckを入れたりDatadogを入れたりRabbitMQを入れたりサービス間通信にgRPCを入れたりもした. Datadogとは前職からの付き合いだけど,使い勝手良すぎて導入せず

                                              LAPRAS株式会社を退職する - PartyIX
                                            • Javaサービスの90%が重大な脆弱性を抱えている――Datadog調査

                                                Javaサービスの90%が重大な脆弱性を抱えている――Datadog調査
                                              • 機密情報が間違ってログ出力されたことを検知する仕組みを、Datadogのセンシティブデータスキャナーで作る

                                                機密情報が間違ってログ出力されたことを検知する仕組みを、Datadogのセンシティブデータスキャナーで作る#Security#Datadog

                                                  機密情報が間違ってログ出力されたことを検知する仕組みを、Datadogのセンシティブデータスキャナーで作る
                                                • スタディサプリ小中高の技術戦略について - スタディサプリ Product Team Blog

                                                  この記事は Enginnering Manager Advent Calendar その2の1日目の記事です。(大遅刻しました) こんにちは。@chaspy です。10月からスタディサプリ小中高*1プロダクト開発部の部長をしています。 本記事では、我々の組織で取り組んでいる技術戦略の現状と今後についてお伝えします。 技術戦略とは何か スタディサプリ小中高の技術戦略 開発比率適正化 課題発見と改善サイクルの確立 直近の取り組み ガイドラインの策定 マイクロサービスの命名 今後追加が予定されているもの monolith の方針検討 共有データベースに対する Model 層の管理方針 api endpoint ごとのオーナーシップ策定 技術戦略グループとして実現したいこと おわりに 技術戦略とは何か ざっくりいうと、事業計画に対して、技術投資をどこにするのか、しないか、です。"技術"投資と言って

                                                    スタディサプリ小中高の技術戦略について - スタディサプリ Product Team Blog
                                                  • みんなでつくる Production Readiness - スタディサプリ Product Team Blog

                                                    こんにちは。SRE の @chaspy です。 以前、Production Readiness Checklist に関する記事を書きました。 quipper.hatenablog.com Production Readiness Checklist の運用開始から1年ほどの月日が経ち、27ものサービスが無事 Production へ出ていきました。 サービスを安心して Production へリリースするために役立っている Production Readiness Checklist ですが、Product Team がこの Check List を進める上でいくつか課題がありました。 本記事では、Production Readiness Checklist 運用開始後に、どのような改善が行われてきたのか、その内容と方法を説明します。また、1年以上の運用を通して、Production R

                                                      みんなでつくる Production Readiness - スタディサプリ Product Team Blog
                                                    • SRE NEXT 2024(のアンドパッドブース)に参加したエンジニアがいまオススメするソフトウェアやサービスとは? - ANDPAD Tech Blog

                                                      こんにちは。SREチームの吉澤です。 アンドパッドは、8/3(土)〜4(日)に開催されたSRE NEXT 2024にゴールドスポンサーとして協賛し、企業ブースとスポンサーLTに参加させていただきました! スポンサーLTでは、SREチームリーダーの角井さんが「アンドパッドのマルチプロダクト戦略を支えるSRE」というタイトルで発表しました。このLTについては、昨日公開された1本目のイベントレポートをぜひご覧ください。 tech.andpad.co.jp 2本目のイベントレポート(この記事)では、アンドパッドブースの様子と、来場者アンケートの集計結果をご紹介します。アンドパッドブースの来場者という範囲に限定されてしまいますが、SRE NEXT 2024に参加したエンジニアがいまオススメするソフトウェアやサービスの傾向が、集計結果から見えてきました。 アンドパッドブースの様子 アンケート項目 アン

                                                        SRE NEXT 2024(のアンドパッドブース)に参加したエンジニアがいまオススメするソフトウェアやサービスとは? - ANDPAD Tech Blog
                                                      • Grafana+CloudWatchを使ったAWSマルチアカウントでのプロダクト監視基盤構築のご紹介 - ACES エンジニアブログ

                                                        ACESのソフトウェアエンジニアの稲田です。私は普段、弊社で提供しているシステムのアーキテクト設計、MLOpsをメインに担当しております。 今回は、ACES Meetという弊社のAIプロダクトサービスをターゲットに弊社のサービス監視基盤を標準化した話について、事例紹介をしたいと思います。 営業支援AIツール「ACES Meet」 想定する読者 プロダクトサービスの品質可視化の重要性について 弊社が抱えていた課題と背景 技術選定の方針 プロダクト監視基盤設計 目的 要件 監視項目 サービス品質 システム詳細メトリクス アラート通知 システム構成 監視ダッシュボードの仕組み Amazon Managed GrafanaのAWSマルチアカウントのデータソースサポート Amazon Managed GrafanaのX-Rayサポート 監視ダッシュボードのデータソースの拡張性 コスト概算 Cloud

                                                          Grafana+CloudWatchを使ったAWSマルチアカウントでのプロダクト監視基盤構築のご紹介 - ACES エンジニアブログ
                                                        • Ruby 3.3.0+YJIT本番運用カンパニーになりました - Timee Product Team Blog

                                                          こんにちは。バックエンドエンジニアの須貝(@sugaishun)です。 今回はタイミーが本番運用しているRailsアプリケーションに対してRuby3.3.0へのアップデートを行った(YJITは引き続き有効なまま)のでその結果をご紹介したいと思います。 昨年弊社のid:euglena1215が書いたエントリーのRuby3.3.0版です。 tech.timee.co.jp 前提 タイミーのWebアプリケーションとしての特性は基本的には昨年と変わりありません。ですので、昨年の内容をそのまま引用させてもらいます。 タイミーを支えるバックエンドの Web API は多くのケースで Ruby の実行よりも DB がボトルネックの一般的な Rails アプリケーションです。JSON への serialize は active_model_serializers を利用しています。 今回の集計では API

                                                            Ruby 3.3.0+YJIT本番運用カンパニーになりました - Timee Product Team Blog
                                                          • 特別コラボ企画の爆発的アクセスを捌き切るエンジニアリングと腕力 - pixiv inside

                                                            こんにちは。ピクシブの社内エンジニア職横断組織「エンジニアギルド」マネージャのbashです。主にエンジニア採用プロセスを取りまとめています。 ピクシブでは複数の事業部があり、様々な専門性を持ったメンバーが集って事業領域にフォーカスする体制を取っています。各事業部にいる技術のキーパーソンがどのような考えでエンジニアリングを進めているのかを紹介したいと思います。 先日、pixivFACTORYというプロダクトで特別コラボ企画があり、普段とは違ったスペシャルな体制でリアルタイム対応が行われました。その件をテーマとして、pixivFACTORYのプロダクト開発と運用を主導しているFACTORY部エンジニアhayaと、ピクシブの全サービスインフラを横断的に管理しているインフラ部SREチームリーダーkonoizに、当日対応や準備の様子について話を聞いてみたいと思います。 まずは自己紹介をお願いします。

                                                              特別コラボ企画の爆発的アクセスを捌き切るエンジニアリングと腕力 - pixiv inside
                                                            • SUZURI のセールとテレビ CM を乗り越えるために負荷試験を実施しました - Pepabo Tech Portal

                                                              こんにちは。 takutaka と申します。最近は暑くて大変ですね。熱中症には気をつけて過ごしましょう。 最近、SUZURI で負荷試験をやったので、そのことについて書いていきます。 概要 Tシャツセールを開催し、その期間に合わせてテレビCMを放映することが決まりました。 アプリケーションやビジネスなど、各領域で達成すべき課題が発生する中、インフラ領域では「最大限の努力をしてセール期間中のダウンを防ぐ」というミッションが与えられました。 パフォーマンスチューニングをやろう、インフラリソースを増強しよう、様々な対応がなされる中、そのひとつとして、負荷試験を実施して各対策の効果を検証することになりました。 僕が主担当として取り組むことになったのですが、問題が一つありました。それは、僕がまともに負荷試験に取り組んだ経験がまったくなかったということでした。 今まで負荷試験をやったことがないエンジニ

                                                                SUZURI のセールとテレビ CM を乗り越えるために負荷試験を実施しました - Pepabo Tech Portal
                                                              • OSSでオブザーバビリティを実現する (Elastic Stack x OpenTelemetry on Kubernetes) - RAKUS Developers Blog | ラクス エンジニアブログ

                                                                こんにちは。インフラエンジニアの gumamon です! 最近はSRE的なことも ちょこちょこ やらせて頂いています。 NewRelic、Datadog、モダンな監視(オブザーバビリティ)って良いですよね。 弊社もKubernetes(k8s)等を利用した環境が増えてきた折、そろそろ必要になってきた(と思っている)のですが、NewRelic、Datadog等のクラウドサービスはランニングコストが安くない。 そこで内製できないかやってみよう!ということになり、試行錯誤をした結果どうにか表題の構成で作ることができたのでご紹介をしたいと思います! この記事では、k8sを観測対象とし、オブザーバビリティを実現した際のアーキテクチャ構成、並びに四苦八苦する中で得た観測の勘所(私見)についてご紹介します。 目次 目次 オブザーバビリティとは オブザーバビリティ(OSS)の実現事例 全体構成 Elast

                                                                  OSSでオブザーバビリティを実現する (Elastic Stack x OpenTelemetry on Kubernetes) - RAKUS Developers Blog | ラクス エンジニアブログ
                                                                • Link and Motivation に入社して3ヶ月が経ちました 🙌 ~ エンジニアが非IT企業で働くという選択肢 ~ - Link and Motivation Developers' Blog

                                                                  はじめまして。Motivation Cloud のエンジニアをしています、宮田と申します。 Link and Motivationには2022年3月に入社しました。 私はキャリアにおいて、SIerやITベンチャーといった創業当時からIT系のサービスを提供する会社に在籍していました。 Link and Motivationのような創業が非ITの会社は初の経験です。 本記事では、入社してから感じたことを書こうと思います(忘れないうちに!)。 Link and MotivationやDXを進める非IT企業に興味を持っている方の参考になれば幸いです🙇‍♂️ Link and Motivation に興味を持ったきっかけ 元々Link and Motivationという会社のことは知っていました。 新卒の就職先としては人気でしたし、グループ会社のopenworkは転職時の参考にしていました。 しか

                                                                    Link and Motivation に入社して3ヶ月が経ちました 🙌 ~ エンジニアが非IT企業で働くという選択肢 ~ - Link and Motivation Developers' Blog
                                                                  • モノリシックなAPIでのカナリアリリース導入と開発者の認知負荷を減らすためConfigMapを使わない選択をした話 - MonotaRO Tech Blog

                                                                    こんにちは、プラットフォームエンジニアリング部門コンテナ基盤グループの岡田です。 当社ではECサイトの裏側で利用されているモノリシックなAPIをコンテナ化し、Elastic Kubernetes Service (EKS) に移行しました。 移行直後は下記のようにトラブルに見舞われましたが、現状安定した運用ができています。 EKSコンテナ移行のトラブル事例:推測するな計測せよ -CoreDNS暴走編- - MonotaRO Tech Blog EKSコンテナ移行のトラブル事例:FargateにおけるAZ間通信遅延の解消 - MonotaRO Tech Blog 今回はトラブル事例ではなく活用事例になりますが、アプリケーションリリース起因でのトラブル影響を減らすため、コンテナ化したAPIに対してカナリアリリース導入を行いました。そのため、導入に際して生じたConfigやSecret周りの課題

                                                                      モノリシックなAPIでのカナリアリリース導入と開発者の認知負荷を減らすためConfigMapを使わない選択をした話 - MonotaRO Tech Blog
                                                                    • 【米国株】全面高でS&P500とNASDAQは最高値更新!航空・レジャー関連が好調。データドッグが決算後、大幅上昇! - ウミノマトリクス

                                                                      米国株市場の状況の振り返りと私見をまとめていきたいと思います。 *1 毎日レバナスとレバFANGに積立しグロース株中心に投資をしているサラリーマン投資家のうみひろ(@uminoxhiro)です。 ブログを読みに来てくださってありがとうございます。 昨晩の米国株市場の振り返りを今日も行っていきます。 今日も成績に左右されないで元気にいくわよ そうだね!では、まずは結論からまとめていきます。 【今日の結論】チェックポイント チェックポイント【結論】 【主要指数】主要指数は全面高となり、S&P500とNASDAQは最高値を更新しています。旅行やレジャー関連株が好感しており、エネルギー銘柄が上昇しています。失業保険申請数は予想とほぼ一致、継続失業保険はパンデミック後初めて300万件を下回り景気回復の兆しが数字として見えています。 【MyPF】私のPFも8月に入り好調を維持しており本日+1.55%と

                                                                        【米国株】全面高でS&P500とNASDAQは最高値更新!航空・レジャー関連が好調。データドッグが決算後、大幅上昇! - ウミノマトリクス
                                                                      • Datadogで深夜バッチの失敗アラートを営業時間に受け取る方法 - Classi開発者ブログ

                                                                        深夜の定期バッチの監視 Webサービスのオフピーク時に重たい処理を実行させるというのは一般的なプラクティスといえます。 特に深夜〜早朝は多くのサービスでバッチ処理を実行させているのではないでしょうか。 Webサービスだけではなく、当然バッチ処理も監視して失敗したらそれを発見し対処したいです。 しかし、失敗を発見しても即座にユーザ影響がないので対応は後でも良いという場合、素朴に監視ルールを作るとバッチが失敗した深夜・早朝にアラートが発報されることになります。 発報されたアラートを見て「これは今すぐに対応してなくても良いな」と判断するのであれば、それは狼少年アラートといえるのではないでしょうか。 悪貨が良貨を駆逐すると言われるように、狼少年アラートがはびこれば良貨のアラートもいずれ無視されるようになってしまうことは容易に想像できます。 Datadogの timeshift 関数でアラートの発報

                                                                          Datadogで深夜バッチの失敗アラートを営業時間に受け取る方法 - Classi開発者ブログ
                                                                        • SREチームで社内GameDayを実施しました

                                                                          GameDayとは 起源はAWSが毎年行っているAWS re:inventの中で開催される行事の1つです。 チームを組んでクラウド・アプリケーションを襲う謎の障害や悪意のある攻撃に対処し、トラブルシューティング能力を競うコンテストとなっています。 のちに様々な企業が社内でも実施するようになり、今ではAWS Well-Architectedのセキュリティ項目でもその実施が推奨されています。 ゲームデーを実施する ゲームデーを実施する: さまざまな脅威について、インシデント対応イベントのシミュレーション (ゲームデー) を実施します。このゲームデーには、主要なスタッフや管理者を参加させてください。 教訓から学ぶ: ゲームデーの実行から得られた教訓は、プロセスを改善するためのフィードバックに含まれている必要があります。 GameDayの手順 今回社内で行なったGameDayの流れです。 1. 発

                                                                            SREチームで社内GameDayを実施しました
                                                                          • ジャンプTOON Web アプリケーションの全体像〜採用技術と開発方針〜 | CyberAgent Developers Blog

                                                                            目次 はじめに Next.js × GraphQL のサーバー間通信 Fastly でのコンテンツ配信とキャッシュ方針 vanilla-extract の採用とスタイリングシステム Chromatic による UI テスト / UI レビュー Datadog でのサービスモニタリング ジャンプTOON の CI/CD リリース戦略とブランチ運用の工夫 おわりに はじめに ジャンプTOON の Web 版(以降、ジャンプTOON Web)の開発を担当している2024年度新卒入社の鏑木 俊樹(かぶらき としき) @tosssssy_ です。 5 月にサービスを開始した「ジャンプTOON」は、オリジナル縦読みマンガ作品や人気作品のタテカラー版を連載する、ジャンプグループ発の新サービスです。 ジャンプTOON Web では Next.js App Router (v14.2)を採用して開発をしてお

                                                                              ジャンプTOON Web アプリケーションの全体像〜採用技術と開発方針〜 | CyberAgent Developers Blog
                                                                            • Amazon Kinesis Data Firehose now supports data delivery to HTTP endpoints

                                                                              Amazon Kinesis Data Firehose now supports streaming data delivery to a generic HTTP endpoint. This feature enables you to use a fully managed service to stream data to an HTTP endpoint without building custom applications or worrying about operating and managing the data delivery infrastructure. Amazon Kinesis Data Firehose incorporates error handling, auto-scaling, transformation, conversion, agg

                                                                                Amazon Kinesis Data Firehose now supports data delivery to HTTP endpoints
                                                                              • メルカリにおけるCDN利用の現在とこれから | メルカリエンジニアリング

                                                                                こんにちは。メルカリ ネットワークチームの@kanemaruです。 メルカリのネットワークチームは、パブリッククラウドのネットワークをはじめとした様々なレイヤに関するコンポーネントの設計・開発・運用を担当しています (参考記事1, 2)。そうしたコンポーネントのうちのひとつが、Content Delivery Network (CDN)です。 メルカリは他の多くのウェブサービスと同様に、CDNを利用しています。現時点ではコンテンツのキャッシュやセキュリティの担保といった、基本的ながら重要な機能に重点を置いて利用していますが、そうした中で見えてきた運用上の課題もあります。この記事では、メルカリにおけるCDNの現在の状況と最近の取り組みを振り返りながら、今後の展望についてご紹介します。 なぜCDNを使うのか? CDNの分野では、コンテンツのキャッシュ機能をはじめとした多彩な機能を様々なプロバイ

                                                                                  メルカリにおけるCDN利用の現在とこれから | メルカリエンジニアリング
                                                                                • ワークフローツールを AWS Step Functions に移行した話 | CyberAgent Developers Blog

                                                                                  AI事業本部の協業リテールメディアdivでソフトウェアエンジニアをしている 中澤 といいます。直近では、プロダクト開発以外にAI 事業本部の新卒研修の運営を行なったりもしていました。 私が所属しているチームで最近、定期バッチを行うワークフロー管理ツールを AWS Step Functionsへ移行したので、移行の背景や得た知見を記事として公開します。 移行前の構成 私たちのチームでは、ワークフロー管理ツールを AWS Step Functions に置き換える前には、Prefect を使っていました。 Prefect に関しては、弊社ブログの別記事があるので、Prefect について知りたい方はそちらも参考にしてみてください。 Prefect を利用している時の構成では、Prefect 側でワークフローのスケジュール管理やワークフロー内のタスク実行を Prefect、実際のワークフローのタ

                                                                                    ワークフローツールを AWS Step Functions に移行した話 | CyberAgent Developers Blog