MADlibは、現代的なデータ分析には欠かせない回帰分析やデータマイニングのアルゴリズムが実装されているオープンソースのライブラリです。 MADlibを導入することによって、これらのアルゴリズムをPostgreSQLのユーザ定義関数の形で使うことのでき、データベースサーバの内部でデータ分析の処理できるようになります。 今回は、このMADlibの導入方法から動作確認、ロジスティック回帰分析における簡単な使い方までをご紹介します。 ■MADlibとは何か MADlibは、もともとはGreenplumというPostgreSQLをベースにしたMPP製品(DWH用RDBMS)を開発していた企業が開発していたライブラリで、Greenplumで利用できるように開発されていたものでした。 2015年9月に、Greenplum(を買収したEMC)がMADlib(や他のソフトウェア類)をApache Foun
![データ分析用ライブラリ MADlib を使って PostgreSQL で機械学習する](https://cdn-ak-scissors.b.st-hatena.com/image/square/813c06fba302d81053a86bc10baf341b8e02dbc0/height=288;version=1;width=512/https%3A%2F%2Fblogger.googleusercontent.com%2Fimg%2Fb%2FR29vZ2xl%2FAVvXsEj0af-Y2rWhO9yyabu_BdFbfOZEjhGuAs7L7W312G1ugeC95BDkEp-WzbR0DfNIXP9czb9AXCfaym-Vl_9AwqyPxUjMVGDNDy-ANe2GNmJvQWqt9VIi_5X57_QWfPHP4HZL5amO88HKdy4%2Fw1200-h630-p-k-no-nu%2Fmadlib.png)