みなさん、こんにちは。 クルトンです! 今回は、前回ブログの流れから、「基本統計量をSQLで把握するのはどうしたら良いのか」という疑問を持ったので、確かめる意味でやってみました。 基本統計量とは、本ブログで以下のものを指します。 最大値 最小値 平均値 中央値 最頻値 分散 標準偏差 SQLの実行環境を準備 前回ブログと同じ内容ですので、知っている方は飛ばしていただいて大丈夫です。 実行環境はGoogle Colabで、ランタイムはCPUです。 まずは必要なモジュールとデータをダウンロードします。 # IPython用のモジュールをダウンロード !pip install jupysql duckdb-engine # データ(csvファイル)のダウンロード !wget https://raw.githubusercontent.com/mwaskom/seaborn-data/master
![Google Colab上でSQLを使って基本統計量を確認してみた | DevelopersIO](https://cdn-ak-scissors.b.st-hatena.com/image/square/d9d7a9e19a3c5979fc0b83efa7beeec666f705bb/height=288;version=1;width=512/https%3A%2F%2Fdevio2023-media.developers.io%2Fwp-content%2Fuploads%2F2015%2F07%2Fsql.png)