タグ

ブックマーク / qiita.com/suzukihi724 (3)

  • Amazon Redshift のパフォーマンスチューニング 十ヶ条まとめ - Qiita

    Amazon Redshift は Serverless版もGAされ、さらにATO:Automatic Table Optimization(自動テーブル最適化)など、従来からある Provisioned版含めてパフォーマンスチューニングがどんどん自動化されてきている。 一方で、実運用では高負荷など使い方によって問題が全く起こらないことは考えにくく、困った時にチューニングの余地があることはメリットでもある。 以下の公式ブログの Tips をもとに困った時のチューニング対処ポイントをまとめる ※ 記事は 2020年 のものなので、その後新機能でカバーできる点や、主観的な考えについて適宜補足しています。 [1] マテリアライズドビューを使う 予測可能で何度も繰り返されるクエリに特に効果を発揮する 内部テーブルだけでなく、外部テーブル(Spectrumやフェデレーション)にも使える マテビューの

    Amazon Redshift のパフォーマンスチューニング 十ヶ条まとめ - Qiita
  • Airflow概要と、Kubernetes/HELM on Rancher で起動 - Qiita

    ETLワークフローエンジン Apache Airflowを、Kubernetes on Rancherで、HELMインストールする設定メモ。 KubernetesやRancherの設定はこちら https://qiita.com/suzukihi724/items/00b167c6f5f2ddeca718 Airflowとは? ・ビッグデータパイプラインを管理するためのワークフロー自動化およびスケジューリングを行うOSS ・2014年にAirbnbで開発され、現在はThe Apache Software Foundationのトップレベルプロジェクトpythonやbashでタスクを定義可能 ・有向非巡回モデル (DAG) としてタスクのワークフローを作る ・複数クラスタでの並列分散実行も可能 ・AdobeやGoogleなど200を超える組織で利用中 ・GCPの「Cloud Compos

    Airflow概要と、Kubernetes/HELM on Rancher で起動 - Qiita
  • よく使うRedshift運用系SQL - Qiita

    よく使うRedshift運用系SQLや運用Tips。 GGなのですぐ忘れる + いちいちググるのに疲れたのでメモ。 随時更新。 [1] クエリ状況系 ◆Runningクエリ確認 select pid, trim(user_name), starttime, substring(query,1,20) from stv_recents where status='Running'; ◆クエリ実行履歴 STL_QUERY クエリの全体を確認したい場合 STL_QUERY の querytxt カラムは、SQLが長いと途中で切れてしまう。 全体をチェックしたい場合は、STL_QUERYTEXT で query(クエリID)を指定して抽出。

    よく使うRedshift運用系SQL - Qiita
  • 1