batchの人気記事 79件 - はてなブックマーク

1 - 40 件 / 79件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

batchの検索結果1 - 40 件 / 79件

batchに関するエントリは79件あります。 aws、バッチ、バッチ処理などが関連タグです。人気エントリには『1000万件オーバーのレコードのデータをカジュアルに扱うための心構え - joker1007’s diary』などがあります。

AWS BatchとServerlessを組み合わせて高速に定期実行バッチやバッチAPIを作る - フリーランチ食べたい
179 users
OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics
113 users
AWS GlueからAWS Batchにしたことで費用を75%削減した - Classi開発者ブログ
73 users
AWS Batch, Lambda, ECS Task 比較：バッチやジョブにはどれを使う？ - Tech Blog
40 users
Google Cloud Batchを使ってバッチの処理待ち時間を1/30以下にしたので紹介させて欲しい - DeLMO（identify）エンジニアブログ
22 users
ウイスキー（644）モンキーショルダースモーキーモンキー BATCH9 - 　紬とウィスキー　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　ウイスキーブログ＆着物生地のブログ
15 users
スコットランドで一番小さいストラスアーン蒸溜所！　ストラスアーン BATCH001　　ウイスキー（803） - 　紬とウィスキー　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　ウイスキーブログ＆着物生地のブログ
14 users
「長さの近いデータを同じbatchに入れる」の性能劣化と速度 - u++の備忘録
9 users
Batchの監視 ~ mkr wrapとhorensoを使いこなす - そーだいなるらくがき帳
8 users
【アイリッシュ】TEELING SMALL BATCH（ティーリングスモールバッチ） - アラサーからウイスキーにハマった人が、ソーダ割（ハイボール）に合うウイスキーを探すブログ(*´з`)
6 users

1000万件オーバーのレコードのデータをカジュアルに扱うための心構え - joker1007’s diary
- 1279 users
- joker1007.hatenablog.com
- テクノロジー
- 2020/11/04
自分が所属している会社のメンバーの教育用資料として、それなりの規模のデータを扱う時に前提として意識しておかなければいけないことをざっくりまとめたので、弊社特有の話は除外して公開用に整理してみました。大規模データ処理、分散処理に慣れている人にとっては今更改めて言うことじゃないだろ、みたいな話ばかりだと思いますが、急激にデータスケールが増大してしまったりすると環境に開発者の意識が追い付かないこともあるかと思います。そういったケースで参考にできるかもしれません。弊社は基本的にAWSによって運用されているので、AWSを前提にした様なキーワードやサービス名が出てきます。後、句読点があったり無かったりしますが、ご容赦ください。追記: 社内用の資料の編集なのでかなりハイコンテキストな内容だから誤解するかもしれませんが、これらはそもそもRDBの話ではありません。(関係無くは無いけど) 1000万オ
- db
- あとで読む
- 設計
- performance
- データ
- database
- 開発
- aws
- プログラミング
- architecture
バッチ処理プラクティス
- 1061 users
- www.yamarkz.com
- テクノロジー
- 2021/12/15
バッチ処理は既に先人の方々が多くのナレッジを公開してくれていますが、それでもなお難しさが変わらないテーマだと思っています。この記事は、筆者がこれまでの開発経験で気づいたバッチ処理の実装ナレッジを整理し、体系化を目指して文章にしました。ここでの内容が、より良い課題解決に貢献できれば幸いです。自身の断片的な思考整理(メモ書き)の延長で内容を整理したため、一部書き振りが統一されておらず、読みにくいかもしれません。ご了承ください。🙏 バッチ処理の難しさバッチ処理は難しい。人によっては簡単なテーマかもしれませんが、自分は難しいテーマだと思っています。「難しさの根源は何か？」を考えると、1. 考慮点が多様にあること 2. 解決する課題によって答えが大きく変わることに整理できました。この2点は、どのソフトウェア開発にも当てはまる項目ではありますが、ことバッチ処理においては顕著に現れます。
データ変更を伴うバッチ処理を書く時に考慮していること - shallowな暮らし
- 526 users
- shallow1729.hatenablog.com
- テクノロジー
- 2022/03/19
こんにちは、id:shallow1729です。最近はインフラ寄りなお仕事をよくやっていますがこれまでにいくつかデータ移行やデータ基盤構築などのバッチ処理のお仕事をしてきました。以前にも一度そういった経験を元に記事を書いたのですが、MySQLやシステムに関する知識が以前よりも増えた今もう一度書き直したいなと思いました。なので今回はバッチ処理を書く時のテクニック2022版という感じです。今の仕事の関係でMySQLやrailsを前提にしている話が多いですが、おそらく他のデータベースを使っている人にも役に立つ話が多いのではないかと思います。ただ、今回の記事は経験に基づくものが多く、あまりよくないアイデアもあるかもしれません。改善点や間違いなどあればご指摘ください。冪等性を持つように冪等性とは端的に言えばある操作を複数回実行しても一回しか実行しなかった時と同じ結果になる性質の事です。長時間かか
- DB
- あとで読む
- batch
- プログラミング
- mysql
- 設計
- バッチ
- データ
- programming
- バッチ処理
バッチ処理について考える - Qiita
- 451 users
- qiita.com/koduki
- テクノロジー
- 2020/01/11
TL;DR ひとくちにバッチといっても色々ある夜間バッチをもう作るなオンラインバッチはSQL以前にDB設計がんばれはじめに Twitterのタイムラインで以下のようなツイートが回ってきました。バッチ処理をみんな舐めてかかったり、ショボイとか思ってる人多い印象なんだけれども、数十万～数千万件規模のデータを処理したことあるのかな。テンプレ通りのコードじゃ動かないよ？ネットに本にも答え載ってないよ？低レイヤも意識しないと動かないよ？ 2020年1月10日ツイートされたわだっしーさんの意図がどこにあるかは確認してないですが、極限の世界でテンプレート的な処理では対応出来ないのはあるよな、と思いつつもある程度はバッチの作法としての書き方があると思っています。このツイートとその関連ツイートを読みながら、そういえばバッチ処理に関して書いてある記事はあまり見ないなぁ、とおもったので他のネットや本

AWSでバッチ処理を実装する際の選択肢とサービス比較
- 401 users
- zenn.dev/faycute
- テクノロジー
- 2021/05/01
処理が複雑でジョブの依存関係を定義したい場合は、AWS Batch 単体で制御するか、より複雑な場合は Step Functions を用いて Lambda、ECS（Fargate）、AWS Batch（Fargate）を組み合わせる。 AWSにおけるバッチ処理の選択肢ざっくりとした選択肢は下記。 Lambda ECS（Fargate） AWS Batch（Fargate）これらのサービスに実際は SQS や Step Functions を組み合わせることもあるので選択肢はさらに広がる。ちなみに、SQS + Fargate（常時起動でポーリング）という構成や、SQS + Lambda + Fargate（都度実行）という構成は、AWS Batch が Fargate に対応した現在は特にメリットがないので取り扱わない。 2021/5/2 追記「常時リクエストがくるユースケー
- aws
- ECS
- あとで読む
- lambda
- バッチ
- batch
- Fargate
- サービス
- Amazon Web Services
- techfeed
66分かかる同期処理を10分以内に短縮せよ！～商品情報同期システムでの、処理速度と運用の改善～ - MonotaRO Tech Blog
- 341 users
- tech-blog.monotaro.com
- テクノロジー
- 2022/08/23
はじめにこの記事では、モノタロウの基幹系を構成するシステムの一つである、商品情報管理システム（PIM：Product Information Management システム）の導入プロジェクトで、商品情報を基幹系と同期するシステム（商品情報同期機能）の性能や運用環境の改善を行った話をご紹介します。背景モノタロウの基幹系は、長年内製のシステムで支えられてきました。基幹系のシステムは、少数のWebアプリケーションと多数のバッチから構成されています。中でも商品情報の管理に関するシステムは、在庫や仕入先に関するシステムと一体化していて、商品情報に関する数多くのマスタメンテナンス画面を備えたやや複雑なシステムです（図１）。図1　基幹系の概略図当社のシステムは、もともと自分たちのビジネスに必要な機能を提供する手頃なパッケージ製品がなかったため、すべてを内製でまかなってきたという経緯があります
レガシーとの向き合い方　〜cron から Rundeck へ〜 - DMM inside
- 265 users
- inside.dmm.com
- テクノロジー
- 2020/08/11
｜DMM inside
- cron
- 運用
- rundeck
- あとで読む
- slack
- サーバ
- システム
- server
- バッチ
- Linux
AWS でバッチ処理・定期実行する4つの方法
- 242 users
- it.kensan.net
- テクノロジー
- 2023/03/31
4つのバッチ処理・定期実行方式の詳細情報それぞれのバッチ処理・定期実行方式について詳細を見ていきます。 EC2について使用するAWSサービスEC2 処理概要Linux系OSで用いられる定時実行機能であるcronのコマンドを使用するメリット昔からよく使われているcronの知識が使えるデメリットEC2インスタンスを起動しておく必要があり、使っていない時間もコストがかかる障害に弱い。EC2サーバに障害があると終わるサーバが複数になると管理が大変 SQS×ECS使用するAWSサービスEventBridge SQS ECS 処理概要EventBridgeでキューを生成。ECSコンテナでキューを取得して実行するメリットECSを起動しておくため、コンテナの起動時間を要さない。デメリットEventBridgeでキューを生成するが、EventBridgeはまれに1 つのイベントに対して複数回トリ
- aws
- あとで読む
- ECS
- lambda
- batch
- 設計
- サービス
- バッチ
- コンテナ
- programming
バッチシステムをクラウドネイティブにするために考えたこと
- 240 users
- speakerdeck.com/teru0x1
- テクノロジー
- 2022/11/21
Cloud Native Days Tokyo 2022 Session: https://event.cloudnativedays.jp/cndt2022/talks/1518
Pythonでいい感じにバッチを作ってみる - prefectをはじめよう - JX通信社エンジニアブログ
- 217 users
- tech.jxpress.net
- テクノロジー
- 2020/12/18
JX通信社シニア・エンジニアで, プロダクトチームのデータ活用とデータサイエンスのあれこれ頑張ってるマン, @shinyorke（しんよーく）です. 最近ハマってるかつ毎朝の日課は「リングフィットアドベンチャー*1で汗を流してからの朝食」です. 35日連続続いています. 話は遡ること今年の7月末になりますが, JX通信社のデータ基盤の紹介&「ETLとかバッチってどのFW/ライブラリ使えばいいのさ🤔」というクエスチョンに応えるため, このようなエントリーを公開しました. tech.jxpress.net このエントリー, 多くの方から反響をいただき執筆してよかったです, 読んでくださった方ありがとうございます！まだお読みでない方はこのエントリーを読み進める前に流して読んでもらえると良いかも知れません. 上記のエントリーの最後で, 次はprefect編で会いましょう. という挨拶で締めさせ
AWSサーバーレスバッチ処理アーキテクチャの構築 | Amazon Web Services
- 209 users
- aws.amazon.com
- テクノロジー
- 2021/11/15
Amazon Web Services ブログ AWSサーバーレスバッチ処理アーキテクチャの構築この投稿は、AWSソリューションアーキテクトであるReagan RosarioとWWPSソリューションアーキテクトであるMark Curtisによって書かれました。バッチ処理は多くの組織にとって基礎となるもので、大量の情報を効率的に自動化した形で処理することができます。ユースケースとしては、ファイル取り込み処理、キューベースの処理、トランザクションジョブ、さらに重いデータ処理のジョブなど、多岐にわたります。この記事では、ファイル取り込み処理を実装するためのバッチ処理を、サーバーレスに実現するための方法を説明していきます。今回の例では、オーケストレーションにAWS Step Functions、オンデマンドのコンピューティングにAWS Lambda、データストアにAmazon S3、メールの送
- aws
- あとで読む
- アーキテクチャ
- serverless
- lambda
- batch
- CPU
- architecture
- Amazon
【AWS】大規模なバッチ処理を支える技術選定
- 199 users
- zenn.dev/rio_dev
- テクノロジー
- 2023/09/21
ここから、表で挙げた内容をそれぞれ解説していきます。構築難度に関しては、関数を実装するだけで済むLambdaが最も簡単で、バッチ専用に特化されたサービスであるBatchに関しては比較的バッチ構築はしやすい印象ですが、ECSに関してはバッチに特化していないため、バッチ処理を行うようにカスタマイズする必要があります。タイムアウト制約に関して留意すべきは、Lambdaの実行時間は15分までなので、それ以上を超える処理時間のバッチは実装できないことです。起動•実行上のオーバーヘッドに関しては、Lambdaにはコールドスタートがあるため起動時にオーバーヘッドを考える必要があり、Batchではジョブをキューに送信して、最適化のために、ある程度のジョブがキューイングしてから実行しようするので、即時性を求める処理には不向きです。既存バッチを移行したいケースがあると思いますが、Lambdaで動かせる
- aws
- あとで読む
- バッチ処理
- batch
- lambda
- architecture
Fargateの運用～デプロイ自動化や監視等～
- 186 users
- speakerdeck.com/yukiiiiikuma
- テクノロジー
- 2021/12/07
初めてFargateを触ったので、運用保守の観点で構築時に設定しておいた方が良いポイントをまとめました。デプロイの自動化と書いているのにデプロイの話薄めになってしまいました…。こちらはJAWS-UG朝会 #28で発表したものになります。
- fargate
- あとで読む
- ecs
- aws
- 運用
- 監視
- デプロイ
- container
- docker
- ci
AWS Batch ベストプラクティスまとめ | Amazon Web Services
- 180 users
- aws.amazon.com
- テクノロジー
- 2021/10/27
Amazon Web Services ブログ AWS Batch ベストプラクティスまとめこの記事はプリンシパル HPC ソリューションアーキテクトの Pierre-Yves Aquilanti、AWS Batch のプリンシパルプロダクトマネージャの Steve Kendrex とプリンシパル HPC アプリケーションエンジニアの Matt Koop によるものです。更新: 2021 年 10 月 5 日セクション 2 に於けるサブネット CIDR ブロックのガイドラインを修正。 AWS Batch は、科学者や技術者が複雑なシステム構成を管理する必要なく、自由にスケールできる計算環境を提供するサービスです。2017 年に登場して以来、疫学、ゲームシミュレーション、大規模機械学習といった諸々のワークロードを稼動させる様々な業種や組織といったお客様に採用されてきました。この投稿で
- aws
- あとで読む
- batch
- コンテナ
- web
- development
- 開発
AWS BatchとServerlessを組み合わせて高速に定期実行バッチやバッチAPIを作る - フリーランチ食べたい
- 179 users
- blog.ikedaosushi.com
- テクノロジー
- 2019/04/28
AWS Lambdaで行えないような重い処理はAWS Batchを使うと簡単に行うことができますが、定期実行したりエンドポイントを作る仕組みはAWS BatchにはまだなくCloudWatchやAPI Gatewayと組み合わせる必要がありますがServerlessと組み合わせることで簡単に実現できるので紹介します。つくるもの今回は次のサンプルを作ってみます。毎日AWS Batchで実行する定期バッチ AWS Batchを実行するAPI 環境 serverless: 1.41.1 aws-cli: 1.16.144 ファイル構成最終的なファイル構成は次のようになります。 AWS Batchに関するファイルだけフォルダを分けています。 tree -L 2 ├── batch │ ├── app.dockerfile │ ├── ecr_deploy.sh │ └── sample.p
- aws
- serverless
- あとで読む
- lambda
- docker
- AWS Batch
- API
- batch
- テクノロジー
EC2とcronで動いていたバッチ基盤をマネージド化した - Uzabase for Engineers
- 176 users
- tech.uzabase.com
- テクノロジー
- 2023/12/21
概要ソーシャル経済メディア「NewsPicks」SREチームの中川です。皆さんはバッチ処理基盤はどうされていますでしょうか。 NewsPicks では少し前まではそれらをEC2、cronの組み合わせで動作させていました。何年も前からこの仕組みだったのですがSREとしてはEC2の面倒見るのも手間ですし、それ以上にcronを変更する際のオペレーションミスが目立ったのが懸念点でした。その為、まずはAWSマネージド化するための基盤を整備し、その後バッチアプリを載せ替えていくようにしました。対応前の基盤構成同じSREチームの安藤さんが CloudNative Days Tokyo 2023 で登壇されたときの資料をお借りします。ご覧の通り、大体のサービスはマネージド化していましたがバッチ基盤だけは旧来のままEC2インスタンスを利用していました。 10年モノのサービスのインフラを漸進的
- aws
- あとで読む
- ECS
- cron
- バッチ
- batch
- architecture
AWSサービスで実現するバッチ実行環境のコンテナ/サーバレス化/ Container service of batch execution environment realized by AWS service
- 175 users
- speakerdeck.com/shoichiron
- テクノロジー
- 2019/10/05
AWS DevDay Tokyo 2019での発表資料です
- aws
- あとで読む
- batch
- バッチ
- ecs
- コンテナ
- container
冪等なデータ処理ジョブを書く - クックパッド開発者ブログ
- 171 users
- techlife.cookpad.com
- テクノロジー
- 2019/07/13
こんにちは、マーケティングサポート事業部データインテリジェンスグループの井上寛之（@inohiro）です。普段はマーケティングに使われるプライベートDMP（データマネジメントプラットフォーム）の開発を行っています。本稿では、その過程で得られた冪等なデータ処理ジョブの書き方に関する工夫を紹介したいと思います。今回は、RDBMS上で SQL によるデータ処理を前提に紹介しますが、この考え方は他の言語や環境におけるデータ処理についても応用できるはずです。まずクックパッドのDMPと、冪等なジョブについて簡単に説明し、ジョブを冪等にするポイントを挙げます。また、SQL バッチジョブフレームワークである bricolage を使った、冪等なジョブの実装例を示します。クックパッドのDMPと冪等なジョブクックパッドのプライベートDMPは、データウェアハウス（社内の巨大な分析用データベースで、クックパ
- バッチ処理
- あとで読む
- cookpad
- 設計
- データ
- SQL
機械学習関連の開発を効率化した話
- 130 users
- speakerdeck.com/nishiba
- テクノロジー
- 2019/05/31
WSDM 2018 論文読み会 Hyperbolic Representation Learning for Fast and Efficient Neural Qestion Answering
- 機械学習
- あとで読む
- luigi
- 学習
- 開発
- analytics
2019年のワークフローエンジンまとめ - Qiita
- 127 users
- qiita.com/elyunim26
- テクノロジー
- 2019/05/31
概要データパイプラインの管理にワークフローエンジンを導入したいのですが、今の要件に対してどれが合っているのか判断しきれない部分があるので整理してみました最近の導入事例や発表をみるかぎりAirflow, Argo, Digdagあたりが人気なのかなと思いますワークフローエンジンとはワークフローエンジンとは定期的なバッチ処理をうまく処理できるように、バッチ実行を管理してくれるソフトウェアのことです古典的な実現方法としては適当なlinuxサーバーの上でcron実行させることが考えられますが、以下のような問題がありますジョブごとの依存関係を表現できない。cronの時間指定で実現させようとすると、タスクAを１時に開始してそれが完了するとみなして依存するタスクBを２時に開始するというような書き方をすることになるが、実際にタスクAが２時までに終わらなかった場合に処理が上手く実行できないタス
- digdag
- あとで読む
- airflow
- oss
- batch
- ワークフロー
- tool
LINEの新しいセルフサービス型バッチデータ収集システム「Frey」の導入
- 107 users
- engineering.linecorp.com
- テクノロジー
- 2021/02/03
Yang Xu2020-12-14Yang is an engineer on the Data Engineering 1 team. こんにちは、Data Platform室Data Engineering 1チームの徐です。 Data Platform室では、大規模なHadoopクラスタを運用し、データ収集、分析、活用するためのプラットフォームを提供しています。Data Engineering 1チームのミッションの一つは、様々なストレージからのdata ingestionシステムを構築、運用することです。本記事では、バッチ処理でデータ収集を行うシステムの概要を説明した後に、LINEのセルフサービスツールであるFreyをご紹介します。従来のバッチ処理システム概要典型的なバッチ処理システムは以下の様な特徴が挙げられます。バッチタスクを実行するには、スクリプトを許可してスケジュ
- LINE
- あとで読む
- batch
- データ
- タスク
- engineering
- システム
- data
ECS Fargate 楽々構築テンプレート｜Dentsu Digital Tech Blog｜note
- 107 users
- note.com/dd_techblog
- テクノロジー
- 2020/12/22
この記事は電通デジタルアドベントカレンダー2020の22日目の記事になります。前回の記事は「ADH APIを効率的に呼び出すために開発したHooksの紹介」でした。改めましてこんにちは！ Docker使ってますか？ AWSでDockerを使おうと思うと以下の３つの選択肢があります。・Elastic Container Service ・Elastic Kubernetes Service ・EC2に構築するこの中でもECSいいですよね、僕も好きです。運用に手間もかからなくて気軽に使えるところに好感もてます。さすがAWSのマネージドサービス。ただし実際にECSで構築しようとすると周辺のリソースが色々と必要になるので初心者にとってハードルが高く見えるのも事実です。そんなわけで初心者にも使えるようなテンプレートを提供したいと思います。このテンプレートでは最低限の機能しか提供しません。何
- ecs
- aws
- fargate
- あとで読む
- docker
バッチ処理のスケジューリングパターン
- 105 users
- medium.com
- テクノロジー
- 2019/12/12
この記事はこの記事は Google Cloud Japan Customer Engineer Advent Calendar 2019 の 12日目の記事です。はじめにGoogle Cloud Platform (GCP) でバッチ処理を起動するための以下のパターンについてご紹介したいと思います。以下、８パターンあげてみました。とはいえ、最後の3つは GCP のバッチスケジューリングという観点からは少し外れますが、バッチの起動時に使われるということでご容赦を。 Cloud Scheduler : フルマネージドな cron ジョブスケジューラです。フルマネージドという点が非常に大きなメリットであり、多くの処理を自動化し実行することが可能です。Google App Engine cron サービス : HTTP GET を利用して、特定の URLを呼び出します。Google AppEng
- GCP
- あとで読む
- cron
- BigQuery
- google
- airflow
- batch
- パターン
- cloud
バッチ処理における冪等性の検討 ─ クラウドネイティブもしくは、はてなダイアリーの自動移行を題材に - Hatena Developer Blog
- 101 users
- developer.hatenastaff.com
- テクノロジー
- 2021/11/30
アプリケーションエンジニアのid:tkzwtksです。今回はバッチ処理の冪等性（べきとうせい、idempotence）について、どう考えるか／考えてきたかをご紹介します。このエントリを書くきっかけとなったのは、はてなエンジニア有志で定期的に開催しているCloudNative推進会です。ここでは、社内のシステムをクラウドネイティブにしていくため「クラウドネイティブなシステムとはどういうものか？」を考えており、この会での「クラウドネイティブなバッチ処理」の議論も踏まえつつ説明していきます。バッチ処理における冪等性とはメッセージ送信の信頼性を考慮するクラウドネイティブで可用性を高めるためにどのような場合に冪等性を考慮すべきか冪等な実装における3つのケーススタディケース1: n分前までに更新されたレコードを集計するケース2: DB上の対象レコードを更新するケース3: 対象ユーザー
メルペイにおける大規模バッチ処理 | メルカリエンジニアリング
- 101 users
- engineering.mercari.com
- テクノロジー
- 2019/06/05
この記事は MERPAY TECH OPENNESS MONTH の 13日目の記事です。こんにちは、メルペイソフトウェアエンジニアの laughngman7743 です。メルペイではマイクロサービスにおけるデータストアのデータや、アプリケーションのログを有効活用できるような基盤づくりをデータプラットフォームチームとして行っています。データプラットフォームではラムダアーキテクチャに基づき、スピードレイヤとして Cloud PubSub と Cloud Dataflow を利用した仕組みに加え、バッチレイヤとして Cloud Composer と Cloud Dataflow を利用した仕組みを構築しています。この記事ではバッチレイヤのアーキテクチャについてご紹介します。スピードレイヤのアーキテクチャについては「GCPでStreamなデータパイプライン始めました」を参照くださ
dron: クラウドネイティブなcron代替の紹介 - Classi開発者ブログ
- 98 users
- tech.classi.jp
- テクノロジー
- 2021/01/21
みなさん、こんにちはこんばんは。Classiの基盤バックエンドチームでプロダクトや機能を越えてサーバサイドを中心に困り事を手広く解決する仕事をしているid:aerealです。今回の記事ではClassiのパフォーマンス改善のため取り組んでいるdronと呼ばれるクラウドネイティブなcron代替 (Cloud Native Cron Alternative) の開発について、運用を見据えてどのような考慮を重ねたのかを紹介します。背景と課題現行のワークロード課題 DBにやさしくないスケールアウトの困難なアーキテクチャ方針設計コンポーネント概説 Facade Job Executor Job Scheduler Endpoint Data Job Data Job Reservation Worker Kicker Worker Endpoint 運用時の考慮事項追跡・トレーシング
- cron
- あとで読む
- DB
- 開発
- システム
- lambda
- Tech
- development
入門Kueue 〜KubernetesのBatchワークロード最前線〜 | gihyo.jp
- 94 users
- gihyo.jp
- テクノロジー
- 2022/10/17
こんにちは、CyberAgentの岩井佑樹（@tenzen-y）です。連載「5分でわかる！Kubernetes/CloudNative」の第3回では、Kubernetes上でのBatchワークロードの扱いに触れた後、Kubernetes NativeなJob Queueing基盤を実現するためのOSSである、Kueueについて紹介します。また本記事で紹介するKueueは、記事執筆時点の最新バージョンであるv0.2.1です。 KubernetesとBatchワークロード Kubernetesではこれまで標準機能として、ロードバランシングやローリングアップデートなどのServiceワークロードのための機能や、Container Storage Interface（CSI）、Container Object Storage Interface（COSI）、Storage Capacity Tra
- kubernetes
- k8s
- あとで読む
- batch
- コンテナ技術
- CPU
- techfeed
広告配信を支えるバッチ基盤をサーバーレス移行した話（ECS Fargate, Step Functions）@ Serverless Meetup Tokyo #16
- 79 users
- speakerdeck.com/pei0804
- テクノロジー
- 2020/02/27
広告配信を支えるバッチ基盤をサーバーレス移行した話（ECS Fargate, Step Functions）@ Serverless Meetup Tokyo #16
- serverless
- aws
- ecs
- Fargate
- バッチ
- batch
- あとで読む
- StepFunctions
- speakerdeck
- container
次世代のワークフロー管理ツールPrefectでMLワークフローを構築する CyberAgent Developers Blog | サイバーエージェントデベロッパーズブログ
- 77 users
- developers.cyberagent.co.jp
- テクノロジー
- 2022/11/02
※ DynalystではAWSを全面的に採用しているため、AirflowもManaged版を調査しています。導入後の状態 Prefect導入後は、以下の構成となりました。ポイントは以下の点です。ワークフローをDocker Image化することで、開発・本番環境の差を軽減 staging・productionはECS Taskとしてワークフローを実行、開発ではローカルPC上でコンテナ実行 ML基盤のGitHubレポジトリへのマージで、最新ワークフローが管理画面であるPrefect Cloudへデプロイ従来のyamlベースのdigdagから、DSに馴染み深いPythonベースのPrefectに移行したことで、コード量が減り開発負荷が軽減しました。 Prefect 入門 ~ 基礎 ~ 注意: 本記事ではPrefect 1系を扱います。Prefect 2系が2022年7月にリリースされてい
- MLOps
- workflow
- aws
- ツール
- あとで読む
形態素解析を行うだけのバッチをつくる - クックパッド開発者ブログ
- 75 users
- techlife.cookpad.com
- テクノロジー
- 2021/03/08
研究開発部の原島です。今日は表題の渋いバッチをつくった話をします。あっちでも形態素解析、こっちでも形態素解析みなさん、形態素解析してますか？してますよね？クックパッドでもさまざまなプロジェクトで形態素解析をしています。いや、むしろ、しすぎです。プロジェクト A でレシピを解析し、プロジェクト B でもレシピを解析し、プロジェクト C でもレシピを解析し、... といった具合です。ちなみに、形態素解析（の結果）が必要なプロジェクトとしてはレシピの分類やレコメンド、各種分散表現（e.g., word2vec）や BERT の学習などがあります。もちろん、最終的に得たい解析結果が違うのであれば問題ありません。しかし、私が見たかぎり、ほとんどの場合は同じ（もしくは、同じにできそう）でした。であれば、解析器をインストール（→ Dockerfile を試行錯誤）解析対象を取得（→ SQL
AWS GlueからAWS Batchにしたことで費用を75%削減した - Classi開発者ブログ
- 73 users
- tech.classi.jp
- テクノロジー
- 2023/08/03
こんにちは、最近データエンジニア業を多くやっているデータサイエンティストの白瀧です。これまでClassiのデータ基盤は、Reverse ETLをしたり監視システムを導入したりとさまざまな進化をしてきました。しかし、Classiプロダクトが発展するとともにデータ量が増加し、これまでのデータ基盤では耐えられない状態に近づいてきました。そこでデータ基盤の一部（DBからのExportを担う部分）のリアーキテクチャを実施したので、この記事で紹介したいと思います。概要 Classiのデータ基盤では、Amazon RDSからAmazon S3へJSONで出力し、その後GCS→BigQueryという流れでデータを送り、BigQueryからもBIツールやReverse ETLなどで使っています。詳細は、Classiのデータ分析基盤であるソクラテスの紹介 - Classi開発者ブログを参照してください。
Cron→Rundeckに乗り換えた話 - MonotaRO Tech Blog
- 73 users
- tech-blog.monotaro.com
- テクノロジー
- 2022/04/12
こんにちは。MonotaROで商品管理や受発注システムの開発を担当している中尾です。この度、これまでcronで実行していたジョブに対してRundeckを導入し、ジョブのスケジュール管理を効率化することができましたので、導入にあたって苦労した点とその解消方法を中心に紹介いたします。 Rundeck導入の背景 Cronの限界を感じた過去にも導入しようとしたが・・・ Rundeck導入において苦労した点 Rundeckが落ちた場合の対応の検討 GitでのRundeckジョブのバージョン管理導入してよかったこと複数のサーバーに跨ってジョブフローが組めること Cron式が使えること重複起動制御ができることまとめ Rundeck導入の背景 Cronの限界を感じた MonotaROでは「注文を倉庫に連携する」、「商品の発注を自動で行う」といった様々なバッチ処理が、細かいものも含めると1日数千
- rundeck
- ジョブ
- cron
- あとで読む
- サーバ
- API
- ツール
入社4ヶ月目で73時間かかるバッチ処理を7倍以上高速化した話 - エムスリーテックブログ
- 67 users
- www.m3tech.blog
- テクノロジー
- 2024/03/26
こんにちは。エンジニアリンググループの武井です。私は現在、デジカルチームに所属し、クラウド電子カルテ、エムスリーデジカルの開発に携わっています。昨年夏にエムスリーに入社し、早くも半年が経過しました。 digikar.co.jp この記事では、私が入社してから4ヶ月目に取り組んだ、バッチ処理の運用改善について振り返ります。特に、新しくチームに加わったメンバーとして意識した点に焦点を当ててみたいと思います。これから新しいチームに参加する方の参考になれば幸いです。改善したバッチ現状の正確な理解現状に馴染む技術選定自分なりの+αを加える改善の結果 We're hiring 改善したバッチ今回の改善対象は、特定の医療機関に紐づく全患者の全カルテをPDFファイルとして出力する、というバッチです。デジカルのデータを医療機関側にエクスポートする用途で使われています。移行前のアーキテ
Kubernetes (EKS) で構築する スケーラブルなジョブ実行基盤
- 65 users
- speakerdeck.com/kekekenta
- テクノロジー
- 2019/08/28
Generative AI in practice: Concrete LLM use cases in Java, with the PaLM API
Amazon LinuxのEOLに伴いバッチをサーバレス化しFargateに移行した話 - クラウドワークスエンジニアブログ
- 61 users
- engineer.crowdworks.jp
- テクノロジー
- 2020/07/20
はじめまして、2020年3月に中途入社したSREチームの @bayashiok です。今回は入社後、Fargateでサーバレスバッチ基盤を構築した話を書いていきます。目次目次経緯 Fargateを選んだ理由 1. リソースの見積もりがCPU/Memoryだけですむ 2.スケーリングを考えなくて良くなる 3. セキュリティレベルの向上につながり管理負荷が減る現行システムで発生している問題点の解消構成 FargateのトリガーとしてRundeckを採用理由1：バッチ実行が行われる場所でログを見たかった理由2：ジョブ失敗やSlack通知の仕組み、リトライ方法やジョブ連携などの作り込みを簡単にしたかった ecs-taskとの連携についてデプロイ 1. wrapperコンテナのデプロイ 2. バッチのデプロイ Fargateタスク実行について移行後の総括よかった点悪かった
- fargate
- ECS
- aws
- rundeck
- あとで読む
- batch
- terraform
たくさんのオンプレサービスをひたすらクラウドに移して得られた知見まとめ - エムスリーテックブログ
- 58 users
- www.m3tech.blog
- テクノロジー
- 2020/12/08
こんにちは、エムスリーエンジニアリンググループの福林 (@fukubaya) です。本記事はエムスリー Advent Calendar 2020 の8日目の記事です。この記事とかこの記事とかこの記事で書いているように、弊社ではオンプレ環境で稼動するサービスのAWSやGCPへの移行が進行中で、ここ数ヶ月でクラウド移行作業が自分の業務の9割を占めています。いろんなサービスのクラウド移行(主にECS Fargate)をやってきて知見が貯まってきたので一旦まとめてみます。当初は何を考慮しなければいけないのかもよく分かっていませんでしたが、数をこなした結果、気をつけるポイントが分かってきました。 Docker化してECS Fargateで動かすのが目標ですが、GCPでk8sでも基本的に考える点は共通だと思います。秩父ミューズパークは、埼玉県秩父市および秩父郡小鹿野町にまたがる地域にある
- docker
- あとで読む
- クラウド
- ECS
- aws
- 環境
定時バッチをECS scheduled task + ecscheduleでお手軽管理する - BOOK☆WALKER inside
- 56 users
- developers.bookwalker.jp
- テクノロジー
- 2022/07/29
メディアサービス開発部モバイルアプリケーション開発課のtukiyo(id: tukiyo320)です。現在はニコニコ漫画のバックエンド開発を担当しています。本記事では、Webサービスに付き物の定時バッチについて、ニコニコ漫画では現在どのような方針で管理・実行しているかをご紹介します。ニコニコ漫画の構成おさらい以下の記事に詳しいですが、ニコニコ漫画のバックエンドは4系統存在しています。どれも現在はAWS上に乗っており、PHPの現行システム以外はECS(fargate)で管理されています。現行PHP(独自フレームワーク) 新バックエンド(Ruby on Rails) React向けBFF(Nest.js) 課金サブシステム(Ruby on Rails) developers.bookwalker.jp 本記事で扱うのは、ロジックの書き直しを目的とした新バックエンドが持つバッチとなります
- ecs
- あとで読む
- aws
faast.js · Serverless batch computing made simple
- 48 users
- faastjs.org
- テクノロジー
- 2019/04/29
Serverless function architectures are optimized for event-driven systems. Faast.js simplifies serverless batch applications by automating infrastructure, code packaging, invocation, and cleanup. Combine the power of scalable serverless functions with the ease-of-use and familiarity of ordinary async functions. Go from zero to a thousand cores in seconds. Scale back down to zero just as quickly. Fa
- serverless
- JavaScript
- lambda
- あとで読む
- TypeScript
- js
- library
- faastjs
Data validation for machine learning 読んだ
- 46 users
- hagino3000.blogspot.com
- テクノロジー
- 2020/07/03
Breck, Eric, et al. "Data validation for machine learning." Conference on Systems and Machine Learning (SysML). https://mlsys.org/Conferences/2019/doc/2019/167.pdf . 2019. 読み手のコンテキスト現職で機械学習予測モデルをプロダクトに投入する様になって3年程経った。そうもなると開発時に想定していた訓練データの分布と現状の分布が乖離して、予測の動作不良を引き起すケースがしばしば見られる様になった。明らかな予測の不具合として目立っていなくとも性能が落ちている部分はもっとあるはずで、これに早く気づいて対応したいモチベーションがある。かつ運用専任メンバーはいないので、できるだけ運用は手を抜きたい。概要著者らはData Validat
MLOpsに必要な情報全部BigQueryに置いたら想像以上に捗った話 - Qiita
- 44 users
- qiita.com/liberaldays
- テクノロジー
- 2020/12/13
本記事はMLOps Advent Calendar 2020の13日目の記事です。こんにちは。昨年本番環境のComposerでやらかしちゃった人です。今年は比較的平穏に機械学習を使用したサービス開発・運用に携われています。携わっているサービスの1つで「MLOpsに必要な情報BigQueryに全部おいてみた」ところ想像以上に便利だったので、その方法について共有させてい頂ければと思います。なお本記事でのMLOpsは予測モデル/ハイパーパラメータのバージョン管理・デプロイ履歴管理推論結果の精度監視 + 入力データの傾向監視を指しています。特に今年はコロナでビジネス環境が日々絶えず変化しているため、これらの施策がサービス品質担保に大きく貢献してくれました。背景毎日一回24時間先までバッチで未来予測し、結果をAPIサーバーにキャッシュする単純なMLサービスに携わっています。なお、予