「OOM」を検索 - はてなブックマーク

41 - 80 件 / 335件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

OOMの検索結果41 - 80 件 / 335件

WEARにおけるKubernetes導入と改善の歩み - ZOZO TECH BLOG
- 60 users
- techblog.zozo.com
- テクノロジー
- 2022/07/20
はじめにこんにちは。ブランドソリューション開発本部　WEAR部　SREの和田（@wadason）です。普段は「ファッションコーディネートアプリ WEAR」のSREとしてクラウドの運用やリプレイスをおこなっています。 WEARはサービス開始から10年が経ち、クラウドやオンプレミスを含む大小様々なシステムが稼働しています。アプリケーションを動かすための基盤にはAmazon ECSのようなコンテナを前提としたものから、オンプレミスのAPIやBatchを動かすIISまで幅広く扱っています。そうした中で、約1年前にSREチームが結成され、技術負債の脱却やクラウドを中心としたインフラの運用を行なってきました。当初取り組んでいた大規模なリプレイス案件も落ち着き、チームメンバーが増えてきたので、現在では分散した技術スタックをKubernetesへ統一するリプレイスプロジェクトを開始しています。本記事で
PHP の各種キャッシュ機構でメモリが枯渇した場合の挙動を調べてみた｜技術ブログ｜北海道札幌市・宮城県仙台市のVR・ゲーム・システム開発インフィニットループ
- 57 users
- www.infiniteloop.co.jp
- テクノロジー
- 2022/03/08
PHP の各種キャッシュ機構でメモリが枯渇した場合の挙動を調べてみたこんにちは。やまゆです。弊社の主軸であるソーシャルゲーム開発においては、マスターデータの存在は欠かせません。マスターデータとは、例えば下記のようなものがあります。武器の名称・アイコン画像名・攻撃力・スキルIDガチャでどのカードが何%の確率で排出されるのか敵を倒した時の報酬ゲーム内イベントの開始日時と終了日時このように、全ユーザーで共有される設定データのことをマスターと呼びます。これらのデータは膨大で、運営を続けていくとアイテムの追加やイベントの追加により、だんだんサイズが肥大化していきます。また、頻繁にアクセスされることが予測されるため、処理上のボトルネックになる可能性が高いです。そのため、サーバサイドでマスターデータを処理する際は毎回データベースへアクセスすることはせず、別の場所にキャッシュしておいて、基本
- php
- あとで読む
- メモリ
- tech
- 開発
- web
Kaggle と出会ってから Master になるまで、そしてこれから。 - 俵言
- 57 users
- tawara.hatenablog.com
- テクノロジー
- 2020/03/24
はじめに以下の Tweet で言っている"長い旅路"の詳細です。完全にポエムかつ長文*1、しかも自己陶酔を多分に含んだ自分語りです。暇かつ心に余裕があって何でも寛大に許せそうな場合にお読みください。奇跡の solo gold を獲得し、遂に Kaggle Master になりました！ Kaggle と出会ってから4年半、一念発起して分析コンペに本気で取り組み始めてから1年半、長い旅路でした。今までチームを組んだり議論したりして下さった皆さん、本当にありがとうございました！これからもよろしくお願い致します！ pic.twitter.com/IzWin2rioa— 俵 (@tawatawara) 2020年3月18日話をしよう。あれは２年... いや５年くらい前の話だったか... といった感じの、むかーしむかしからの話*2。Kaggle と出会ってからの人生(の一部)の紹介みたいなも
スノーフレイク (SNOW) の技術的な企業分析
- 54 users
- www.axion.zone
- テクノロジー
- 2020/10/12
Snowflake（SNOW）は、2012年に設立されたクラウドベースのデータウェアハウス企業である。カリフォルニア州サンマテオに拠点を置く、同社は9月下旬にニューヨーク証券取引所に上場し、米国での株式公開で過去最大のソフトウェア企業となった。当初、株式の価格は75ドルから85ドルの間と予想されていたが、同社は120ドルで上場し、取引初日には300ドルにまで急上昇した。これは別の記録を更新した。スノーフレークは、上場初日に株式価値が2倍になった史上最大の企業となり、時価総額は750億ドル近くに達した。これまで多くの企業データはオンプレミスで保存されてきた。つまり、データは企業が管理する物理サーバーに保存されていた。OracleやIBMなどの現存企業が伝統的にこの領域を支配してきた。しかし、Snowflakeは根本的に違う。Snowflakeは、データをオンプレミスに保存するのではなく
- snowflake
- あとで読む
- ストレージ
- データ
- システム
- database
- webservice
- 技術
- 企業
- web
LiteFS+SQLiteでフルスタックNext.jsアプリケーションを作る
- 54 users
- zenn.dev/laiso
- テクノロジー
- 2022/10/23
なぜLiteFS+SQLiteか「個人開発のコストはDB次第」でサーバーレス環境でコンピューティングリソースを節約できたけどマネージドDBはまだ高いよ(要約)ということを言っていたら「本番環境でSQLiteを使うといいよ」と何人かの人に教えてもらってLitestreamのことを知った。 LitestreamはDBを読み書きするプロセスを1つにして利用するので、サーバーレス環境でsqliteファイルをパスで参照できて、複数箇所から掴まないように構築すれば条件は整えることができる(Cloud Runのように並行に呼び出してもインスタンスが共有されるサービス+最大サイズを1にしておく、とか)。 Litestreamのみでも便利に使えていたんだけど、プロジェクトをウォッチしていたらその後サーバーを複数台にしてそれぞれのインスタンスで同じ結果を得られたり、書き込み先を適切にハンドリングするデザイン
- sqlite
- Next.js
- あとで読む
- db
GoとGCSで100GBの巨大zipファイルを展開する | Re:Earth Engineering
- 53 users
- reearth.engineering
- テクノロジー
- 2024/06/21
はじめにファイルをアップロードすることができる機能を持ったWebアプリケーションやクラウドサービスは世の中に多数あります。しかし、アップロードしたzipファイルを自動で展開（解凍）してくれて、中身のファイルが閲覧できる機能を持ったサービスは、あまり多くはないかもしれません。もし、Google Cloud上で、zipファイルをアップロードし自動的に展開してGCSに配置するシステムを作るとしたら、どうやって実現すればよいでしょうか。たとえ100GBのzipファイルでも問題なく展開できるようにするには？そんな難題に挑み、GCSにアップロードされた100GB級のzip/7zファイルを自動的に展開することができるシステムをGoで実装し、プロダクションレベルで実現しました。その技術について解説します。背景 PLATEAU VIEWの画面 Eukaryaでは、国土交通省が主導しているProjec
- GCS
- Golang
- Go
- GCP
- あとで読む
- Cloud
Amazon Linux 2023がGAされました | DevelopersIO
- 52 users
- dev.classmethod.jp
- テクノロジー
- 2023/03/16
抜粋 : Release cadence - Amazon Linux 2023 メジャーリリースとマイナーリリースの内容は以下AWS公式ドキュメントに記載されています。メジャーリリース時には互換性があるか十分に検証した上でアップデートしましょう。 Major version release— Includes new features and improvements in security and performance across the stack. The improvements might include major changes to the kernel, toolchain, Glib C, OpenSSL, and any other system libraries and utilities. Major releases of Amazon Linux ar
- AWS
- Linux
- あとで読む
- Amazon
- まとめ
RustのWasm周りのクレートまとめと、Trunkを使ってRustで書いたWasmをブラウザ上で簡単に実行する
- 51 users
- zenn.dev/matcha_choco010
- テクノロジー
- 2022/06/11
wasm-packを使うことで、ビルドしてwasm-bindgen-cliでさらに変換処理を行い、npmで配布可能なパッケージにするという多段階必要なビルド手順をまとめることが可能です。またnewコマンドのようなテンプレートから生成する機能などもあり、より手軽にWasmの実行を行えます。後述のTrunkとの違いは、wasm-packはwebpackなどのJavaScript側で使われるバンドラーなどと合わせて使うことが想定されていることです。 webpackと合わせて使わない場合には今回のテーマであり後述するTrunkを利用したほうがより簡単にWasmの実行を行えます。 wasm-opt GitHub binaryenというリポジトリでwasm-optというツール含むいくつかのツールが作られています。 wasm-optはその名の通りWasmの最適化をしてくれるツールです。与えるオプシ
- rust
- WebAssembly
- wasm
- あとで読む
- browser
- techfeed
ESP32系MCUで無線LAN受信バッファが枯渇するときの調査方法 - Nature Engineering Blog
- 49 users
- engineering.nature.global
- テクノロジー
- 2024/05/01
ファームウェアエンジニアの井田です。今回はESP32系MCUで無線LANによる受信ができなくなる問題の原因と調査方法について解説します。背景 ESP32にてそこそこ頻繁に無線LAN経由の通信を行っているときに、環境によっては急に通信ができなくなる現象が発生しました。そこで、Wiresharkを用いて通信状況を確認すると、どうもESP32側からの送信パケットは届いているものの、ESP32へのパケットは受信されていないような状況が確認されました。例えば、ESP32側からDNSのリクエストを投げて、ルーターが返答をしているのにも関わらず、ESP32のログ上は名前解決に失敗した状態になっています。また、TCPによる通信も何度も再送が発生しており、よくよく見てみると、ESP32側がACKを返さないので、通信相手のサーバが再送してきているという状態でした。現象より、ESP32の無線LANド
AWS Advanced JDBC WrapperによるAurora Postgresの高速フェイルオーバー - エムスリーテックブログ
- 49 users
- www.m3tech.blog
- テクノロジー
- 2023/02/22
【デジスマチームブログリレー1日目】こんにちは。デジスマチームの山本です。クリニック向けDXサービスであるデジスマ診療のWeb フロントエンド・バックエンド・インフラを担当しています。今回は先日AWSから発表されたaws-advanced-jdbc-wrapperについて紹介します。はじめに AWS Advanced JDBC Wrapper 提供Plugin フェイルオーバーとはこれまでのフェイルオーバー対策 AWS Advanced JDBC Wrapperを利用した場合のフェイルオーバー対策 Failover Connection Plugin Host Monitoring Connection Plugin 導入方法 Gradle(Kotlin)での依存先の追加 Spring Boot + HikariCPでの設定例実際に動かしてみた何も設定しない場合設定後
- postgresql
- aws
- Aurora
- jdbc
- あとで読む
- Java
- DB
- techfeed
LIFULLを支えるKubernetesエコシステムまとめ 2020年版 - LIFULL Creators Blog
- 48 users
- www.lifull.blog
- テクノロジー
- 2020/08/03
技術開発部の相原です。以前にブログで書きましたが、LIFULLでは主要サービスのほぼ全てがKubernetesで稼働しています。 www.lifull.blog Kubernetesをアプリケーション実行基盤として本番運用するためにはデプロイやモニタリング・ログ、セキュリティなど考えることが多くどこから手を付ければよいか困ることがあるでしょう。そこで今回は既に数年の運用実績のあるLIFULLのアプリケーション実行基盤で利用しているKubernetesエコシステムについて紹介します。全て書くと数が膨大になるので今回はクラスタ周りを中心に、必要とするソフトウェアの数が多いモニタリング・ログまでとします。(それでも大作になりそうですが...) kubernetes/kops projectcalico/calico coredns/coredns node-local-dns kubern
- kubernetes
- あとで読む
- Docker
- techfeed
- 考察
- programming
がんばらないDBaaSの作り方 - KADOKAWA Connected Engineering Blog
- 48 users
- engineering.kdx.co.jp
- テクノロジー
- 2020/03/30
はじめにはじめまして、KCS部のmaruです。KCS部では、部長といくつかのサービスのオーナーをやっています。 KCS部は、KADOKAWAグループ向けプライベートクラウド(以下KCS)を提供しており、私がオーナーをしているサービスにはDataBase as a Service(以下DBaaS)があります。主な利用者は株式会社ドワンゴがサービスを提供している『niconico』です。今回はKCSが提供しているDBaaSについて、いかに頑張らないで運用できるようにしているかについて投稿します。規模で見るKCS DBaaS KCSが現在提供しているDBaaSは下記の3つです。 KCS RDB基盤 for MySQL バージョン：MySQL 5.7系 MySQL数(概算)：450 masterの総データ量(概算)：3TB KCS Cache基盤 for Redis*1 バージョン：Red
ElastiCache Redisのメモリ溢れが起きたときの挙動、正しく理解できてますか？？ | DevelopersIO
- 47 users
- dev.classmethod.jp
- テクノロジー
- 2020/04/30
こんにちは(U・ω・U) ElastiCacheおじさんを目指して日々鍛錬を続ける深澤です。立派なElastiCacheおじさんに成長することを決意したラスベガスでの出来事でした。 — 深澤俊 (@shun_quartet) December 4, 2019 皆さん、ElastiCacheのRedisにどんどん情報を保存していって、メモリが溢れたらどんな挙動になると思いますか？ざっくりEvictionが発生してキーが削除されていくんじゃないの？と思われている方も多いかと思います。ですが実はそうとも限らないんですよ。今回はEvictionってなんだろう？というところから、メモリが溢れた場合の挙動について整理していきたいと思います。 Evictionとは？？どんどんデータが保存されて行ってmaxmemoryに到達した際、発生する挙動です。ちなみにCloudWatchのメトリクスで検知が可能
RendertronをGKEとCloud Runで構築しました - pixiv inside
- 46 users
- inside.pixiv.blog
- テクノロジー
- 2020/06/12
こんにちは、インフラ部の id:sue445 です。今回はRendertronをGKEとCloud Runの両方で構築した話をしたいと思います。 tl;dr; 前置き今までのRendertronの問題点 GKE版Rendertronについて GKEの採用理由について GKE版Rendertronの構成全体 GKE内部 pod内部 Kubernetesの設定と解説 rendertron-deployment.yaml rendertron-hpa.yaml rendertron-ingress.yaml rendertron-service.yaml Tips nodeのストレージサイズをケチり過ぎたらpodが起動できなくなった N1マシンタイプのnodeとN2マシンタイプのnodeを比較した結果、N2マシンタイプが安くなった Cloud Run版Rendertronについて Clou
- GKE
- cloudrun
- k8s
- gcp
- Cloud Run
- kubernetes
- cloud
Containers the hard way: Gocker: A mini Docker written in Go
- 44 users
- unixism.net
- テクノロジー
- 2020/06/18
They are popular and they are misunderstood. Containers have become the default way applications are packaged and run on servers, initially popularized by Docker. Now, Docker itself is misunderstood. It is the name of a company and a command (a suite of commands, rather) that allow you to manage containers (create, run, delete, network) easily. Containers themselves however, are created from a set
- container
- docker
- golang
- あとで読む
- go
- techfeed
バグ調査やパフォーマンス改善に役立つ！eBPFを用いたトレーシングについて | さくらのナレッジ
- 44 users
- knowledge.sakura.ad.jp
- テクノロジー
- 2020/06/17
はじめにこの記事では、Linuxカーネルに実装されているパケットフィルタであるeBPFを使ったトレーシングツール、具体的にはDTrace, SystemTap, bpftrace,bcc-toolsなどについて紹介させていただきます。この記事の目標を以下に示します。 DTraceやSystemTapを簡単に説明し、eBPFを用いたトレーシングのうれしいところをお伝えします。 bpftraceやbcc-toolsといったツールの簡単な使い方を紹介し、細かいツールを調べる上での足がかりになるようにします。公式の資料がかなり充実していることをお伝えします。この記事で使っている画像はそこから使わせていただいています。 eBPF概説 eBPFは、Linuxカーネル3.15からBPF(Berkeley Packet Filter)の拡張仕様として導入されました。BPFはこれまでにもパケットフィルタ
- eBPF
- BPF
- performance
- linux
- カーネル
- 統計
- tool
- ネット
How to start SRE in a small team, all by yourself. - Money Forward Developers Blog
- 43 users
- moneyforward-dev.jp
- テクノロジー
- 2022/02/10
「少人数のチームにて、一人からSREを始めるにはどうすればいいのか？」 2021年の10月からHR領域（マネーフォワードクラウド勤怠）でSRE組織を立ち上げているVTRyoです。もっとサービスをより安定させたい！より向上したいといった話から、SREという役割を設置するケースは増えています。しかし、SREという概念のなかったチームや部署で始めるにはどこから手をつければよいのでしょう。 SREの基本について記されたSRE サイトリライアビリティエンジニアリング――Googleの信頼性を支えるエンジニアリングチームには多くの原則が書かれていますが、同じことを丸々取り組むには前提や環境が違う部分も出てきます（SREのプラクティスを知るにはよい参考資料であることは間違いありません）。というわけでこの記事では、以下の部分に答えられるよう進めていきます。 SRE本を読んだが、実際の組織やチームでは
- sre
- 組織
- tech
- あとで読む
Kubernetesをぶち壊す10の奇妙な方法 (後編) - Qiita
- 43 users
- qiita.com/inductor
- テクノロジー
- 2019/12/15
はじめにこれは、ZOZOテクノロジーズ #4 Advent Calendar 2019 13日目のエントリーです。前回の前編記事に引き続き、Airbnbのエンジニアたちが経験したクラスターでのやらかしをあれこれご紹介します。 6. Where's my Custom Resource?（ワイのカスタムリソースはどこに？） AirbnbではKubernetesのCustom Resourceをよく使用しています。特に、Kubernetesクラスターの外部にあるが、ストレージ、ダッシュボード、アラート、IAMロールなどのAWSリソースなどのサービスに関連付けられているリソースを追跡するために使っています。こうしたCustom Resourceを使う上で大変なのが、「そのリソースがいつ利用可能になったか」や、「そのリソースに関する変更がいつ反映されたか」を検知することです。最初のうちは
ISUCON 予選突破のために Elastic Stack と GCP で分析環境を整えた（:old_noto_innocent: Team） - Unyablog.
- 42 users
- nonylene.hatenablog.jp
- テクノロジー
- 2022/07/24
ISUCON 12 予選にいつもの id:utgwkk, id:wass80 と :old_noto_innocent: チームで参戦した*1。結果は 50696 点で本選出場！ここ数回と同様、自分はインフラと分析・観測を担当していた。ただ、毎年似たようなことをやっていてあまり貢献できていないなあという課題感があったので、今回はログやメトリクスの分析環境をしっかり作ることにした。目標は毎回ベンチ終了のたびにコマンドを叩くのをやめること！ App 周りについてはチームメイトの記事を参照。 blog.utgw.net memo.wass80.xyz Elastic Stack でアクセスログ・スローログ可視化ダッシュボード最高便利 Google Cloud でトレーシング & プロファイリング Trace Profiler やってよかった構築編 Elasticsaerch + Kib
- isucon
- GCP
- あとで読む
- cloud
- 環境
- google
Using Native Memory by JVM | DevelopersIO
- 41 users
- dev.classmethod.jp
- テクノロジー
- 2019/11/21
はじめにこんにちは。事業開発部のこむろ＠さっぽろです。最近、諸事情から所属部署でどこにでも顔を出す人として活動しています。今回はJVMのメモリ周りについて初めて調べました。背景 Javaアプリケーションを利用している場合、最近ではContainerを利用してアプリケーションを起動しているところも多いかと思います。わたしの所属する事業開発部では、ECSを利用して複数のJavaアプリケーション（Spring Boot）をContainerで稼働させています。 Containerで稼働させるため一つのホストのリソースをすべて割り当てられるわけではありません。Containerには利用できるリソースにハードリミットが設けられているため、リソースの配分には少々気を使う必要があります。今まであまり意識してチューニング等していなかったのですが（富豪的にメモリを割り当てたりしてて深く考えていなか
- java
- jvm
- container
- メモリ
- memory
- performance
- あとで読む
第814回　1500円以下で買えるRaspberry Pi PicoサイズのRISC-VボードなMilk-V DuoでUbuntuを動かす | gihyo.jp
- 40 users
- gihyo.jp
- テクノロジー
- 2024/05/22
Ubuntu Weekly Recipe 第814回1500円以下で買えるRaspberry Pi PicoサイズのRISC-VボードなMilk-V DuoでUbuntuを動かす Ubuntu 24.04 LTSではRISC-Vボードのひとつである「Milk-V Mars」をサポートしました。これは中国のRISC-V製品のベンダーであるMilk-Vが作っているRaspberry Piライクなシングルボードコンピューターです[1]。ただしこのMarsはなかなか入手できない状況が続いています。Milk-Vでは他にも64コア搭載されたPCライクなPioneer、10GbEのネットワークスイッチとして使えるVegaなどもリリースしています。今回はRaspberry Pi Picoサイズの小さなボードで、比較的安価で入手性が高いMilk-V Duoシリーズに、Ubuntuをインストールしてみましょう
- Linux
- あとで読む
- USB
- IoT
- Ubuntu
- techfeed
Preferred Networks におけるHadoop - Preferred Networks Research & Development
- 40 users
- tech.preferred.jp
- テクノロジー
- 2020/06/29
Preferred Networks （以下PFN）では、「現実世界を計算可能にする」「全てのひとにロボットを」という目標のもと、機械学習を始めとしたあらゆる計算技術を用いて研究開発に日々取り組んでいます。その過程では必ずといっていいほど、データの保存や読み出しが必要になります。ここでは、我々がどのようにデータ管理をしているか、また、その過程でどのようにHadoopを利用しているかについて紹介したいと思います。写真: PFNカラーリングのストレージサーバー Hadoop導入の経緯 Hadoopが多く利用されているようなログ分析や、エンタープライズ向けのETL処理やデータサイエンスに比べると、深層学習の分野でよく利用されているような規模のデータは比較的小さいです。よく画像認識のベンチマークとされるImageNetの2012年のコンペで利用されたデータセットは200GB程度です。これはそもそ
- hadoop
- cdh
- あとで読む
- データ
スタディサプリにおけるKarpenterの導入トラブル振り返り - スタディサプリ Product Team Blog
- 39 users
- blog.studysapuri.jp
- テクノロジー
- 2023/11/20
スタディサプリにおけるKarpenterの導入トラブル振り返りこんにちは。スタディサプリ小中高SREの@aoi1です。スタディサプリでは、Kubernetesを利用しているのですが、Nodeの運用自動化のために2023年3月から本番環境を含む全環境でKarpenterを導入しています。 Karpenterのおかげで開発者体験を向上させることができたり、コスト削減を行うことができました。便利で良いことが沢山ある一方、本番環境で問題が発生するなどいくつかハマったこともありました。本ブログでは私たちがハマったポイントを通じて、Karpenterの導入を検討している方、あるいは既に本番環境でKarpenterを運用している方にとって参考になればと思います。 Karpenterとは KarpenterはAmazon Web Sevice(AWS)が開発しているOSSで、「Karpenter s
- kubernetes
- あとで読む
- aws
- hatena
- Design
Mirrativ iOSアプリでのメモリ使用量削減への取り組み - Mirrativ Tech Blog
- 38 users
- tech.mirrativ.stream
- テクノロジー
- 2023/09/07
こんにちは、iOSエンジニアのふじのです。 Mirrativの機能開発を進める傍ら、iOSアプリのメモリ使用量の改善に取り組んでいます。今回は、アプリ内でメモリ使用量を増やしている問題点を見つける方法と、それらをクライアント実装で解決する具体的なアプローチについて紹介します。 Mirrativアプリが抱える課題着眼点とアプローチ画像キャッシュの効率化 UIImageのリサイズ画像のメモリキャッシュの上限サイズ設定メモリリークへの対策 Allocationsやmemory graphを利用した手動検出 XCTestを利用したCI上での自動検出改善の成果と今後の課題 We are hiring! 参考リンク Mirrativアプリが抱える課題 Mirrativアプリはライブ配信機能や視聴機能、Unityを利用したアバター機能やWebGLを利用したゲーム機能など、メモリを多く必要とす
第56回　Linuxカーネルのコンテナ機能 - cgroup v2から使うメモリコントローラ（1） | gihyo.jp
- 36 users
- gihyo.jp
- テクノロジー
- 2024/08/16
前回は、カーネルのお話から一度離れて、LinuxContainersプロジェクトから発表されたIncusというプロダクトを紹介しました。少し間が空いてしまいましたが、今回からはまたLinuxカーネルの機能紹介に戻りましょう。第53回、第54回で紹介したCPUコントローラの話に続いて、メモリコントローラのお話をします。メモリコントローラについては、以前、第5回で簡単に説明しています。このときの説明はcgroup v1のメモリコントローラを説明しました。今回は、cgroup v2のメモリコントローラを紹介します。メモリ回収処理とメモリ負荷コントローラを説明する前に、メモリコントローラを説明する前提となる、メモリの回収処理とメモリ負荷について簡単に紹介します。さらに詳しい情報については、Linuxカーネルの解説文書などをご参照ください[1]。 OS実行中には、色々とメモリを使う要素が存在
- linux
- あとで読む
- kernel
- article
OOMしたCronJobのメモリ制限を「いい感じ」に増やし、不必要な課金・障害対応を減らす - エムスリーテックブログ
- 35 users
- www.m3tech.blog
- テクノロジー
- 2024/04/12
初めまして、2024年3月後半にエムスリーのAI・機械学習チームで10日間インターンに参加させていただいた東（@azuma_alvin）です。もしタイトルが何かに似ていると感じた方がいれば、只者ではないと思われます。洗練されたデザインでかっこいいと思ったエムスリーオフィスの受付の写真この記事では、KubernetesのCronJobでOOM（Out Of Memory）が発生した時に「いい感じ」にメモリ制限を増加させてくれるbroomの開発経緯とその実装についてお話しします。また、インターン期間で感じたエムスリーという「ギーク集団」の中で開発する楽しさについてもお伝えできればと思います。 2週間でゼロ（nil）から開発したbroomは、OSSとしてGitHubで公開しているのでコントリビュートお待ちしております！ github.com CronJobのOOMとは CronJobのO
- fargate
- 開発
- *あとで読む
- AI
- OSS
- 機械学習
その後のgolangと(Dockerと)OOM — KaoriYa
- 34 users
- www.kaoriya.net
- テクノロジー
- 2020/08/16
前の記事:golangとDockerとOOM を書いた後で Go側の事情に変化があったため、あの記事に書かれた方法は現実的な選択肢ではなくなってしまいました。この記事では私が使っているGo 1.14以降でのOOM対策と、どうしてそうせざるを得なかったのか解説をお届けします。 TL;DR Goの64ビット版はVSZの最小要求量が大幅に拡大した (500MB超) 前の記事で紹介した方法が現実的ではなくなった VSZの制限をRSSに転用する=最低でも500MBのRSSを設定することになる代わりに自プロセスのRSSを監視して閾値を超えたらアポトーシスするようにした RSS取得用のkoron-go/phymemパッケージを作成した Background あの記事を書いた翌月末にGo 1.14がリリースされました。その変更点の中に以下の記述があります。 The page allocator
- golang
- go
- docker
- あとで読む
- プログラム
- Linux
redis threadedI/Oの検証 - MicroAd Developers Blog
- 34 users
- developers.microad.co.jp
- テクノロジー
- 2021/06/28
はじめにマイクロアドでインフラエンジニアをしている柏木です。マイクロアドでは広告配信に高速なKVSであるRedisを使用しています。 Redisはシングルスレッドでの高速性、安定性を売りにしていました。しかし6.0でマルチスレッド機能であるThreded I/Oが追加されました。広告配信で多用している、Redisを高速化できるのであれば積極的に導入したいので検証を行いました。はじめに Threded I/OとはシングルスレッドでのRedisの処理マルチスレッドでのRedisの処理 io-threads io-threads-do-reads + io-threads 検証環境 OSの追加設定今回の検証結果前提条件指標の取得方法について loopbackアドレスを利用した検証実行CPUの指定 Redisの起動コマンド Redisのconfigについて暖機運転検証1：I
- redis
- DB
- あとで読む
Kubernetes CPU リクエスト & リミット VS オートスケーリング
- 34 users
- sysdig.jp
- テクノロジー
- 2023/03/18
本文の内容は、2023年3月16に JASON UMIKER が投稿したブログ（https://sysdig.com/blog/kubernetes-cpu-requests-limits-autoscaling）を元に日本語に翻訳・再構成した内容となっております。以前のブログ記事で、Kubernetesのリミットとリクエストの基本について説明しました：これらは、クラウド環境のリソースを管理するために重要な役割を果たします。このシリーズの別の記事では、クラスターに影響を与える可能性のあるOOMとCPUスロットリングについて説明しました。しかし、全体として、リミットとリクエストはCPU管理のための銀の弾丸ではなく、他の選択肢の方が良い場合があります。このブログポストでは、次のことを学びます： CPUリクエストの仕組みCPUリミットの仕組みプログラミング言語別の現在の状況リミットが最適
CircleCI の Android Docker Image でJDKが11にアップデートされた件のまとめ - nashcft's blog
- 32 users
- nashcft.hatenablog.com
- テクノロジー
- 2020/08/22
私は今回の件より前から CircleCI を使っておらず、最近は主に GitHub Actions でCIを構築していてこの件で被害は被っていないのだけど、軽く調べてみたところ Android project を JDK 9+ でビルドすることに強い興味をを持っている自分には結構興味深いことがわかったのでもう少し詳細に調べてまとめることにした。何があったの日本時間で 2020-08-18 のお話 CircleCI の Android Docker Image が更新され、JDK 8 ベースから JDK 11 ベースになった*1 これらの image を使ってCIを行っている Android project でビルドが失敗するものが発生した Twitter が少し賑やかになった原因1: なぜビルドが失敗するようになったのこの blog を書き始めてから調べて知った付け焼き刃な部分もあ
- CircleCI
- CI
- Android
- Java
- Docker
- JDK
- あとで読む
日本語CLIP 学習済みモデルと評価用データセットの公開
- 31 users
- blog.recruit.co.jp
- テクノロジー
- 2024/01/29
はじめに基盤モデルがAIの新潮流となりました。基盤モデルというとやはり大規模言語モデルが人気ですが、リクルートでは、画像を扱えるモデルの開発にも注力しています。画像を扱える基盤モデルの中でも代表的なモデルのCLIPは実務や研究のさまざまな場面で利用されています。CLIPの中には日本語に対応したものも既に公開されていますが、その性能には向上の余地がある可能性があると私たちは考え、仮説検証を行ってきました。今回はその検証の過程で作成したモデルと評価用データセットの公開をしたいと思います。公開はHugging Face上で行っていますが、それに合わせて本記事では公開されるモデルやデータセットの詳細や、公開用モデルの学習の工夫などについて紹介します。本記事の前半では、今回公開するモデルの性能や評価用データセットの内訳、学習の設定について紹介します。記事の後半では大規模な学習を効率的に実施す
Who murdered my lovely Prometheus container in Kubernetes cluster?
- 31 users
- engineering.linecorp.com
- テクノロジー
- 2020/06/02
As of October 1, 2023, LINE has been rebranded as LY Corporation. Visit the new blog of LY Corporation here: LY Corporation Tech Blog This blog post is about an interesting experience I had while investigating and resolving a problem that happened in the Prometheus container which was still in the CrashLoopBackoff state. The phenomenon itself and the solution are obvious and simple; so simple that
- prometheus
- kubernetes
- container
- Microservices
- line
- IT
Rust 1.60を早めに深掘り - OPTiM TECH BLOG
- 31 users
- tech-blog.optim.co.jp
- テクノロジー
- 2022/04/08
こんにちは、R&Dチームの齋藤（@aznhe21）です。新オフィスは広くて快適です。さて、本日4/8(金)にRust 1.60がリリースされました。この記事ではRust 1.60での変更点を詳しく紹介します。 4/8は釈迦の誕生を祝う花まつりの日ピックアップコンパイル時間を計測できるようになった機能（features）で名前空間付き・弱依存がサポートされたコード網羅率を計測できるようになった [u8]を文字列としてエスケープできるようになった安定化されたAPIのドキュメント Arc::new_cyclic パニックサンプル Rc::new_cyclic パニックサンプル slice::EscapeAscii <[u8]>::escape_ascii サンプル u8::escape_ascii サンプル Vec::spare_capacity_mut サンプル Maybe
W杯全64試合無料生中継で「落ちない」を実現。「小さく壊れる」ために行った負荷・障害・セキュリティ対策とは？【ABEMA DEVELOPER CONFERENCE 2023#3】
- 29 users
- levtech.jp
- テクノロジー
- 2023/05/26
TOPコラムテック最前線レポートW杯全64試合無料生中継で「落ちない」を実現。「小さく壊れる」ために行った負荷・障害・セキュリティ対策とは？【ABEMA DEVELOPER CONFERENCE 2023#3】 W杯全64試合無料生中継で「落ちない」を実現。「小さく壊れる」ために行った負荷・障害・セキュリティ対策とは？【ABEMA DEVELOPER CONFERENCE 2023#3】 2023年5月25日株式会社AbemaTV　Software Engeneer 辻純平 2013年サイバーエージェント入社。2018年からABEMAのAPI開発チームに異動。W杯負荷対策ではAPI、データ基盤などのアーキテクトとして活動し、現在はSREとして従事。日本代表の躍進に日本中が沸いた、2022年の「FIFA ワールドカップカタール 2022」（以下、W杯）。ABEMAにて全64試合の無料
- あとで読む
Kubernetes で運用する JVM アプリケーションの OutOfMemoryError に備える - Uzabase for Engineers
- 28 users
- tech.uzabase.com
- テクノロジー
- 2020/08/18
こんにちは。SPEEDA 開発チームの old_horizon です。 JVM アプリケーションの運用について回るのが、OutOfMemoryError (以下 OOM) への対処です。しかし実際に発生した際に、適切なオペレーションを行うのは意外と難しいのではないでしょうか。特に本番環境では、まず再起動して復旧を急ぐことも多いかと思います。しかし、ただそれを繰り返すばかりでは原因がいつまでも特定できません。今回は Kubernetes で運用する JVM アプリケーションに対して、ダウンタイムを抑えつつ調査に役立つ情報を自動的に収集する仕組みを構築してみたいと思います。環境構築 OOM 発生時に、自動的にヒープダンプを取得しコンテナを再起動する java コマンドのオプション指定補足ヒープダンプ出力先のボリュームをマウント readinessProbe によるヘルスチェックレ
- Kubernetes
- java
- JVM
- 運用
- あとで読む
Datadog Profilerで継続的なProfilingを実施できるようにした話 - unless’s blog
- 28 users
- unless.hatenablog.jp
- テクノロジー
- 2021/09/21
おまえだれ? 株式会社Kyash でサーバサイドエンジニアをしている @uncke__ko です Fundsチームに所属していて主にお金の入出金部分を担当していますこれは何? Kyashではシステムの監視やモニタリングにDatadogを使用しています www.datadoghq.com Datadogにある Continuous Profilerという機能を使い、継続的にProfilingできる環境を整えたのでその話になります docs.datadoghq.com Profilerとはプロファイラとはアプリケーションの性能を解析するためのツールですソフトウェア開発をしていると下記のようなことが度々起こった経験が1度はあると思います OOMが発動するようになる latencyが遅くなるアプリケーションの動作が徐々に重くなる Profilerがあると、このようなときにアプリケーションの
Firebaseで作る！リアルタイム画像変換CDN【Firebase Hosting + Cloud Functions】 - AppBrew Tech Blog
- 28 users
- tech.appbrew.io
- テクノロジー
- 2020/01/15
AppBrew新規事業部の開発責任者をしています吉野です．前回記事を書いてから書きたくないと駄々をこねていたら歳月が経ちその間に猫を飼い始め配偶するなど様々なライフステージの変化がありました．ところで，アップロードされた画像をそのまま表示する時代は平成とともに終わりを告げたわけですが[※要出典]皆さんいかがお過ごしでしょうか．今回の記事では，まずはじめにFirebase Consoleポチポチだけで出来る「Cloud Functionsのみを利用する例」を解説した後に，そこで生じた問題点を解決した「Cloud Functions + Firebase Hosting を利用する例」を順に説明していきます．これからFirebaseを作ってアプリを作る方，Firebaseを利用していていくつかのサイズの画像を柔軟に扱いたい方などの参考になればと思います．記事後半の「Cloud Fu
- Firebase
- CDN
ナイキが浦和、鹿島、広島のアウェーユニフォームを白＆赤の統一テーマにすると発表　紫がチームカラーの広島は「カープからインスパイア」 :
- 27 users
- blog.domesoccer.jp
- エンタメ
- 2019/12/23
650 U-名無しさん 2019/12/23(月) 12:11:16.82 ID:r9MjLDos0 https://www.sanfrecce.co.jp/news/other/2409 これは受け入れ難い… 668 U-名無しさん 2019/12/23(月) 12:21:04.92 ID:SwyBhaJOx >>650 ママさんバレーじゃねーかｗ 695 U-名無しさん 2019/12/23(月) 12:39:28.32 ID:OFInxtiS0 >>650 何でエンブレムの縁を赤で囲んでんだよこれが一番許せないんだが 703 U-名無しさん 2019/12/23(月) 12:43:03.68 ID:dN GNgAvM >>650 意味わからんｗｗｗ 654 U-名無しさん 2019/12/23(月) 12:13:53.76 ID:UXO4nQm4d 赤はねーなぁ大体なんで3チーム
iOSのOOMクラッシュをみつける - DeNA Testing Blog
- 26 users
- swet.dena.com
- テクノロジー
- 2023/01/27
こんにちは、SWETグループ所属のkariadです。昨年10月に開催されたiOS Test OnlineにてSWETチームのkuniwakが「実践9つのメモリリークどう見つける？」というタイトルで発表しました。その発表では触れられなかった、メモリリークから引き起こされるOOMクラッシュを発見する手法についてSWETで実践したことを紹介します。メモリリークについての説明は多くの記事で説明されているため、省略します。 OOMクラッシュメモリリークが発生するとOOMクラッシュの危険性があります。 OOMとはOut Of Memoryの略であり、アプリが確保しているヒープ領域を超えてメモリを利用しようとした際に、OSからアプリがキルされクラッシュしてしまいます。通常のクラッシュにおいては大半のアプリで導入されているであろうFirebase Crashlyticsにて検知可能です。一方で
維新・馬場代表「辻元氏はブーメランのプロ」　旧統一教会との接点判明で
- 25 users
- www.sankei.com
- 世の中
- 2022/09/27
日本維新の会の馬場伸幸代表は２７日の記者会見で、世界平和統一家庭連合（旧統一教会）との接点が判明した立憲民主党の辻元清美参院議員について、これまで辻元氏が自民党と旧統一教会との関係を問題視していたことを念頭に「あの人はブーメランのプロだ」と突き放した。