Struggle against crossdomain data complexity in Recruit GroupDataWorks Summit/Hadoop Summit
本記事は、Spark, SQL on Hadoop etc. Advent Calendar 2014の8日目の記事だったはずの原稿です。 Movielensデータセットを使って、HivemallにおけるMatrix Factorizationの実行方法を解説します。 はじめに 以前、Hadoop Conference 2014で発表させて頂いたときに聴衆の方にアンケートをとったところレコメンデーションの需要が(クラス分類か回帰分析と比べて)非常に高いという傾向がありました。Hivemallのv0.3以前もminhashやk近傍法を用いたレコメンデーション機能をサポートしておりましたが、v0.3からはMatrix Factorizationもサポート致しました。 本記事では、HivemallにおけるMatrix Factorizationを用いた評価値の予測方法を紹介します。 Matrix
This document discusses Hivemall, a scalable machine learning library for Apache Hive. It provides concise summaries of machine learning algorithms as user-defined functions that can run on large datasets in Hive. The document outlines the motivation for Hivemall, what algorithms it supports, how to use it to perform tasks like data preparation, training models, and prediction, and how it handles
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く