[B! SQL] ymym3412のブックマーク

複数の企業でデータエンジニアとして求められたスキル - yasuhisa's blog

最近「ああ、これ前職でも前々職でもやったことあるなぁ」という仕事があった。データエンジニア(やその関連職種)として働き始めて約5年、3社でフルタイムとして働いてきて「このスキルは業界や組織規模が変わってもデータエンジニアとしてスキルを求められることが多いな」と感じたものをまとめてみることにした。棚卸し的な意味はあるが、特に転職用などではないです。前提どこでも必要とされたスキルデータマネジメントに関する概要レベルの知識と実行力セキュリティや法令に関する知識事業ドメインに関する興味関心他職種とのコミュニケーション能力コスト管理 / コスト削減のスキルソフトウェアエンジニアとしてのスキル DataOpsやアラートのハンドリング能力分析用のSQLを書く力古いテーブルやデータパイプラインを置き換えていくスキルや胆力あるとやりやすいスキル関連部署の動きを何となく把握しておく力

ymym3412 2024/04/30

リンク

新しいSQLフォーマッターであるuroboroSQL-fmtをリリースしました | フューチャー技術ブログ

コアテクノロジーグループの山田です。先日、新しいSQLフォーマッターであるuroboroSQL-fmtをリリースしました 🎉 このツールは弊社が公開しているPostgreSQL向けのSQLコーディング規約に基づき、SQL文をフォーマットするツールです。弊社でのSQLフォーマッター開発の取り組み元々弊社ではuroboroSQL Formatter（以下uroboroSQL Formatterを旧版、uroboroSQL-fmtを新版と呼ぶ）というSQLフォーマッターを公開していました。旧版は字句解析して得られたトークンを基にフォーマットするという設計になっていたため、SELECT句のエイリアス補完といった文法を考慮する必要のある機能の追加が困難Pythonで書かれておりVSCodeの拡張機能として動作させるのが難しいという課題を抱えており、それを解消するため新たなSQLフォーマッター

ymym3412 2023/11/22

リンク

GoでSQLの複雑なクエリのテストを書いてみた - ZOZO TECH BLOG

はじめにこんにちは。ブランドソリューション開発本部FAANSバックエンドブロックの佐野です。普段はサーバーサイドエンジニアとして、FAANSのバックエンドシステムを開発しています。 FAANSとは、弊社が2022年8月に正式ローンチした、アパレル店舗で働くショップスタッフの販売サポートツールです。例えば、コーディネート投稿機能や成果確認機能などを備えています。投稿されたコーディネートはZOZOTOWNやWEAR、Yahoo!ショッピング、ブランド様のECサイトへの連携が可能です。成果確認機能では、投稿されたコーディネート経由のEC売上やコーディネート閲覧数などの成果を可視化しています。本記事では、成果データの集計処理におけるBigQueryのクエリ実行処理のユニットテストをGoで実装した取り組みと、その際の工夫についてご紹介します。目次はじめに目次成果データの集計処理とは抱え

ymym3412 2023/10/11

リンク

SQL Chat

Chat-based SQL Client and Editor for the next decade

ymym3412 2023/07/17

SQL
AI

リンク

Postgres と MySQL における id, created_at, updated_at に関するベストプラクティス

読者対象ある程度データベースに関する知識を持っている，経験年数 1 年以上のバックエンドエンジニア特定のプログラミング言語に依存する部分は含めないため，すべての SQL 使用者を対象とするまた，ゼロからの丁寧な説明というよりは，リファレンス感覚で使える記事という形にまとめる。 RDBMS の対象バージョン PostgreSQL: 9.4 以降 MySQL: 8.0.28 以降 id （データ型と INSERT 時のデフォルト埋め）導入一般的に採用されやすいプライマリキー用の値として，以下を考える。連番整数 MySQL では AUTO_INCREMENT， Postgres では IDENTITY や SERIAL と呼ばれるもの UUID v1: ハードウェアごとにユニークな単調増加値 UUID v4: ランダム値 UUID v7（ドラフト）: 単調増加であるタイムスタンプとラ

ymym3412 2022/06/16

リンク

オレ的EXPLAIN技を語っちゃうゾ - Qiita

メリークリスマス本記事はPostgreSQL Advent Calendar 2021の25日目です。今年も面白い記事がたくさん揃いましたね！！！さて、みなさん今年のPostgreSQLライフはどんな感じでしたでしょうか？私はというと、なんだかチューニングばっかりやってました。1案件でいろいろお手伝いすることはまあまああったのですが、複数から次々チューニングの相談をもらって、歴代継承者の個性を発現したデクくんのごとく駆け回ったのが今年のハイライトです。（この綱渡り感、、、伝われ！！！）俺たちは雰囲気でチューニングしている今回上手くいったけど、あの時たまたまひらめいた1案をぶつけてみたら効果でたのであって、次善の策なんてなかったけど？？って毎回思ってるから、雰囲気でやっていると思う、マジで。コミュニティのノリだと笑いが起きていいんですけど、少しでも勝率を上げるために、若手の前でド

ymym3412 2021/12/27

リンク

SQL等価性検証ツールCosetteを使ってみた - Qiita

はじめに皆さん、SQLチューニングしてますか？（唐突）私は仕事柄RDBMSのSQLチューニングをすることが多いのですが、たまにチューニングの一環で SQL文の書き換えをすることがあります。その際に問題になるのが、書き換えたSQL文が等価であるかどうかの確認が大変なことです。 SQL文を書き換えた場合には、想定通りの結果を取得できるか確認するために、テストをやり直す必要があります。これが開発早期のフェーズならまだましなのですが、結合テスト以降だと手戻りも多くかなりコストがかかりますし、既に本番運用が始まったシステムともなると、テスト自体が困難なこともあります。また、複雑なSQL文だと網羅的なテストケースを作成すること自体が困難であるため、完全に正しいと確信することはできません。なので、SQL文の書き換えの正しさを証明する良い手段はないかと考えていました。 SQLチューニングとは

ymym3412 2021/12/26

SQL

リンク

実際に使うSQLの書き方徹底解説 / pgcon21j-tutorial

- PostgreSQLカンファレンス 2021 - チュートリアル - https://www.postgresql.jp/jpug-pgcon2021 - 詳細はこちら https://github.com/soudai/pgcon21j-tutorial

ymym3412 2021/11/13

リンク

SQLが重いときに見るお気軽チューニング方法

SQLのチューニング方法昔Qiitaで書いたものをzennにうつして、若干の修正、追加をしてみました。 ORACLEでの経験を元に書いていますがコストベースのリレーショナルデータべースなら大体共通の考え方だと思うので他にも使えると思います。 SQLのチューニングといえば比較的容易に済むインデックスをとりあえず作成する。といった対応を取られがちですが、数万レコード程度でのデータ量ではあまり効き目がなく（自分の経験則）、どちらかといえば、結合順が大幅に狂ってたりすることが原因のことが多かったりします。よって本当にインデックスがないことが原因なのか？を熟考する必要があります。（例えばID以外のフラグとかコードに単項目indexを貼ってるのもみたことがあります。怖いけど実話）また、インデックスを作りすぎるとオプティマイザが狂いやすくなって他のSQLにも悪影響を及ぼしたりするので結構熟慮して追加

ymym3412 2021/05/09

リンク

PostgreSQLを遅くしている犯人はどこだ？

PostgreSQLを遅くしている犯人はどこだ？：Linuxトラブルシューティング探偵団（3）（1/3 ページ） NTTグループの各社で鳴らした俺たちLinuxトラブルシューティング探偵団は、各社で培ったOSS関連技術を手に、NTT OSSセンタに集められた。普段は基本的にNTTグループのみを相手に活動しているが、それだけで終わる俺たちじゃあない。引き続きOSSに関するトラブルの解決過程を＠ITで連載していくぜ。ソースコードさえあればどんなトラブルでも解決する命知らず、不可能を可能にし、多くのバグを粉砕する、俺たちLinuxトラブルシューティング探偵団！　助けを借りたいときは、いつでもいってくれ！ OS：高田哲生俺はリーダー、高田哲生。Linuxの達人。俺のようにソースコードレベルでOSを理解している人間でなければ、百戦錬磨のLinuxトラブルシューティング探偵団のリーダーは務まらん。

ymym3412 2021/04/28

リンク

PostgreSQLの実行計画を読み解こう(OSC2015 Spring/Tokyo)

12. 12 2.プラン演算子にはどんなものがあるの？分類演算子表スキャン Seq Scan Index Scan Bit map Index Scan Bit map Heap Scan Index Only Scan Subquery Scan Tid Scan その他 Function Scan 結合 Nested Loop Merge Join Hash Join 分類演算子検索結果への処理 Group limit Unique Aggregate Group Aggregate Result 結果の結合 Append SetOp その他の処理補助 Sort PostgreSQLの演算子は様々

ymym3412 2021/04/28

リンク

Cloud SQL でスロークエリを出力する

Cloud SQL（GCP）でスロークエリを出力する方法です。ちなみにStackdriver Logging の料金が軽微ですがかかります。 MySQLの場合はここを見るといいのですが、Postgresの場合はなぜか同様のここをみても手順が書いていません。ほぼ同様（フラグ名が異なる）ですが、Postgresqlの場合は・まずCloud SQLの管理画面でスロークエリの出力を行いたいインスタンスの概要を開きます。・次に、上部の「編集」を押して下の方にある「設定オプション内」、「フラグ」をクリックして開きます。・「項目を追加」を押して「log_min_duration_statement」を選び、値を設定します。 -1を設定すると出力せず、0の場合はすべて出力、1以上の場合は1なら1ms以上のクエリをすべて出力します。 1秒以上のクエリを出力したければ1000と入れます。・「保存」

ymym3412 2021/04/27

リンク

Google の SQL parser/analyzer の ZetaSQL とは何であるか

2019年4月に Google の SQL parser/analyzer の ZetaSQL が公開されました。現在 BigQuery Standard SQL や Cloud Spanner で実装されている SQL 方言であり、 Cloud Next 2019 で BigQuery UI から Cloud Dataflow で実行されるパイプラインを記述できる機能として発表された Cloud Dataflow SQL にも使われることがツイートからも見て取れます。 ZetaSQL については Google の外の人がまともに言及しているのを見たことがなく、聞いたことがないか様子見という人が多いと思うので分かっていることを書いていきます。既存の文献から見る素性ZetaSQL は Spanner の SQL 実装について書かれた Spanner: Becoming a SQL Sys

ymym3412 2020/02/09

リンク

目指せ！！SQLの配列マスター - Qiita

はじめに最近仕事でBigQueryを触り始めたのですが、配列の処理に悪戦苦闘していました。この記事では、私がBigQuery上でより上手く配列を扱うために調べたコトや取り組んだコトをまとめました。なお、この記事ではUDFでJSを使わない方針で記述しています。 BigQueryで配列に関わる命令一覧 https://cloud.google.com/bigquery/docs/reference/standard-sql/arrays?hl=ja https://cloud.google.com/bigquery/docs/reference/standard-sql/functions-and-operators?hl=ja 上記の公式ドキュメントから配列が関係するものを引っ張ってきただけですので、あしからず。操作系 ARRAY: サブクエリを配列化 ARRAY_CONCAT: 配

ymym3412 2020/01/23

BigQuery
SQL

リンク

検索ログから「じわじわ検索頻度が上昇しているキーワード」を見つける - クックパッド開発者ブログ

こんにちは。トレンド調査ラボの井上寛之（@inohiro）です。普段は法人向けサービス「たべみる」の開発を担当しています。たべみるはクックパッドの検索ログを基にしたサービスで、任意のキーワードの検索頻度、キーワード同士の組み合わせ検索頻度、およびそれらを地域や年代・性別で絞り込んで分析することができます。トレンド調査ラボでは「たべみる」の開発のほか、クックパッド上のトレンドを見つけるために日々調査を行っています。ここでのトレンドとは、「流行っている」もしくは「流行りそう」といったものを指します。消費者が気になっているキーワードが何かを知ることで、消費者が求めている情報を適切に提供できると考えています。今回は、膨大な検索ログの中から「じわじわ検索頻度が上昇しているキーワード」を見つけるために行ったことについて紹介したいと思います。じわじわ検出「じわじわ検索頻度が上昇して

ymym3412 2019/07/13

リンク

sqlparseによるSQLのフォーマット - Qiita

SQLをローカルでフォーマットするツールを探していてsqlparseというツールを見つけたので試してみました。インストール sqlparseはPython製でpipを使ってインストールすることができます。ウェブ上で使用する sqlparseはSQLFormatというオンラインサービスで使用されており、ブラウザやAPIでSQLを渡してフォーマットすることができます。 SQLFormat - Online SQL Formatter コマンドラインで使用する sqlparseをインストールすると使用可能になるsqlformatというコマンドにファイルか標準入力でSQLを入力するとフォーマットされたSQLが出力されます。 -r で改行・インデント、-k upper でキーワードを大文字にすることができます。その他のオプションについては-h オプションで確認することができます。 $ SQL=

ymym3412 2019/01/27

リンク

はてなブックマーク

タグ

関連タグで絞り込む (19)

SQLに関するymym3412のブックマーク (16)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス