こんにちは。俺やで。 ビッグデータとかデータサイエンティストとかいう言葉が未だブームですね。 (「データサイエンティスト」は下火か。) ビッグデータ扱えるエンジニアも、 統計解析ができるアナリストも、 どっちもできるスーパーマンも世の中にはたくさんいますが、 ビッグデータも統計解析も扱えるインフラは多くはない現状です。 そこで! この記事では、 ビッグデータに対応したHiveで使える機械学習ライブラリ、 「Hivemall」の使い方を学ぼうじゃないか! という志をたくさん表現するべく書いています。 そして統計やるんだったら、 初歩的だけどおもしろいロジスティック回帰がいいだろうなと、 これを取り上げました! ちなみにですが、 あくまで「Hivemallの使い方」に重きを置くので、 統計云々みたいな深い話は最低限しかしません。 あとTreasureDataで試させていただきました。 いつもお
![【超入門】Hivemallで機械学習 〜Treasure Dataでロジスティック回帰編〜 | DACエンジニアブログ:アドテクゑびす界](https://cdn-ak-scissors.b.st-hatena.com/image/square/4ed9dfc0936aae73d79e9e198ed8ea5aab874504/height=288;version=1;width=512/http%3A%2F%2Fimg.ak.impact-ad.jp%2Fic%2Fpone%2Fivt%2Fyebisupress%2Fimg%2Fth_ogp_image.png)