記事へのコメント95

    • 注目コメント
    • 新着コメント
    el-condor
    途中からリトライ可能にするのは案外難しい。でも0.1Mレコードまでなら全部リトライすりゃええやんが最適だけど10Mレコードとなるとそういうわけにもいかないからね。

    その他
    rochefort
    大変そう

    その他
    tri-star
    大量データを扱う処理で気を付けたいことが色々まとまっている

    その他
    NetPenguin
    「カジュアルに扱うための心構え」 カジュアルな手段では無く、カジュアルに扱えるように研鑽しとけって話か……

    その他
    irof
    わかる人は思いっきりうなづいて読みそうな一言一言。現場で読み合わせ/認識合わせとかすると良さそう。現場でね。コンテキスト合ってないと多分すれ違う。

    その他
    impreza98
    Redshiftは良いぞ

    その他
    teckl
    リトライ機構、冪等性の維持、工程ごとのログなど他の分野でもめっちゃ同意できる知見だ… 古のバッチの知恵が現代にも生きているなぁ…

    その他
    issyurn
    “1000万オーバーの件数から数件取るとかそういう話ではなく数億件の中から1000万件を取得して数分以内に処理を終わらせるとかそういう処理を頻繁に(カジュアルに)実装しなければならない弊社の話でした。”

    その他
    sucelie
    これでカジュアルなんだから胃腸がやられそうだ

    その他
    snowcrush
    "手癖で書くな" は重要やね。問題を変形せずに頭の中のワークフローをそのまま書き下してしまうと大体きつくなってくる

    その他
    rawwell
    "at least onceはexactly onceより圧倒的に処理負荷が軽い、羃等であるならat least onceで安全に処理できる "

    その他
    y_maeyama
    "手癖で書かない"がピンとこないなぁ。経験しないとわからないことなのかしら。

    その他
    natu3kan
    通信の過信と通信がオーバーヘッドになるのあるある。ってのと工程ごとにログを吐いてくれないと躓きが見えないから辛いのある。

    その他
    akahigeg
    “ちょっとでも関係しそうなサービスを見かけたらとりあえずドキュメントを読む癖を付けておかないと、いざという時に思い付かなくなる。” つらみ

    その他
    iga_k
    大量レコードじゃなくても使える知見だ!

    その他
    t-wada
    joker さんの知見が詰まっていてすばらしいエントリ。「手癖で書くな」はよくわかる……

    その他
    innocencecrash
    カジュアルに扱うためには正統な手続きが色々必要ってわけですね。

    その他
    azmin
    バッチ処理やってると案件固有で潰しがきかないアイデアなんじゃないかと思うことばっかりだけどこれだけエッセンスを抽出できているのは尊敬する

    その他
    kappaseijin
    バッドノウハウな知見集。AWS、TD、その他のサービスも落とし穴沢山なので入口より出口を知るの重要

    その他
    kotaponx
    ミッションクリティカルでなくて、割とどうでもいいrerun OKなログ系のデータしか扱ってないけど、それでもそれなりに工夫はいるという感覚はある。

    その他
    okami-no-sacchan
    レコードの話かと思ったのに

    その他
    teto2645
    後で読ませる。

    その他
    cloverstudioceo
    インデックスを貼れとかそういうレベルの話じゃなかった。。。

    その他
    rjge
    “適宜ログを吐かないと、どこまで進んでいるか分からない” “一方で一件単位で詳細なログを吐くとログのデータサイズやログ出力の負荷が馬鹿にならない” 悩ましい。手癖は耳が痛い…

    その他
    shikiarai
    多分必要ないノウハウ(願望

    その他
    kagehiens
    これは有り難い知見だ。社内環境で完結しているのはきょうび恵まれている内に入るのだなぁ。

    その他
    masalib
    「既存のコードを信用するな」・・・痛いほど分かります

    その他
    pitti2210
    なんとなく一瞬かわんごのブログかと思ったら違った

    その他
    rryu
    大量データのバッチ処理の話だった。この辺はいつでも変わりなく、処理時間を含むリソース消費量、エラーハンドリング、リトライの設計をちゃんとしないと死ぬぞという話になる。

    その他
    kako-jun
    1000万パワーすごい。人口の多いアジアならではの知見ですね。1つ心構えを足すとすれば、自室に同じ規模のDBを構築して日々夜間バッチの実験をすることで経験値の取得ペースが倍になります

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    1000万件オーバーのレコードのデータをカジュアルに扱うための心構え - joker1007’s diary

    自分が所属している会社のメンバーの教育用資料として、それなりの規模のデータを扱う時に前提として意...

    ブックマークしたユーザー

    • rudo1082024/11/13 rudo108
    • gonhainu2024/10/10 gonhainu
    • chopwave2024/06/23 chopwave
    • eeeichan2024/05/13 eeeichan
    • febc_yamamoto2024/03/24 febc_yamamoto
    • kokoichi2062024/02/18 kokoichi206
    • uesima2024/02/11 uesima
    • s-takaya10272024/01/10 s-takaya1027
    • fhduyshshehe2024/01/03 fhduyshshehe
    • dot96gal2023/12/28 dot96gal
    • kazutanaka2023/11/01 kazutanaka
    • celeron1ghz2023/06/24 celeron1ghz
    • techtech05212023/05/06 techtech0521
    • knj29182023/01/21 knj2918
    • yshz2022/11/07 yshz
    • subprotein2022/10/12 subprotein
    • karahiyo2022/09/19 karahiyo
    • yojik2022/07/01 yojik
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む