2019年12月19日のブックマーク (1件)

  • ゼロ年代後半ゆるふわ情報系学生がSQLのクラスタリングをやってみた - エニグモ開発者ブログ

    インフラチームの山口です。 ゼロ年代後半ゆるふわ情報系学生でしたが紆余曲折の末にインフラエンジニア1年目となりました。 今回は編集距離を使用してSQLのクエリをクラスタリングしてみたので記事にまとめてみます。 奇しくも、伊藤直也さんのブログで編集距離の記事が公開されたのが2009年だったのですが、時の流れの速さを感じてしまいます。 1.背景 DBCPU負荷のスパイク時に、DBのクエリのログを取得・人手で集計して、CPU負荷が高いクエリを改善するという運用を実施することがあります。 ログ(クエリ)の量が少ない場合は良いのですが、大きくなるにつれ、人手での集計に伴い以下のような問題が発生しています。 人手での集計には時間を要する 作業者が変わると結果が一意に決定できない場合があり、集計作業の再現性がない スクリプトに起こして作業をしようとしても、 単純な文字列一致の方法で集計を試みると、WH

    ゼロ年代後半ゆるふわ情報系学生がSQLのクラスタリングをやってみた - エニグモ開発者ブログ
    pompom0c0
    pompom0c0 2019/12/19