タグ

Apacheとmachinelearningに関するkana321のブックマーク (2)

  • Mahoutイン・アクション

    Apacheプロジェクトが提供するオープンソースの機械学習ライブラリ、Mahoutについて包括的に解説する書籍です。協調フィルタリングによるレコメンデーションについて、オンメモリ実装からHadoopベースの並列実装までを説明することで、分散環境における機械学習アルゴリズムの全体像を明らかにします。また、データの中で似た者同士をクラスタにグループ化するクラスタリングアルゴリズムに触れ、さらに分類器の構築、サンプルデータを使って「学習」させる方法を説明します。実装例を示しながら実践的に解説する書は、Mahoutをマスターしたいエンジニア必携の一冊です。 訳者による日語版サポートページ 序文 訳者まえがき はじめに 1章 Apache Mahoutへようこそ 1.1 Mahoutものがたり 1.2 Mahoutが扱う機械学習の分野 1.2.1 レコメンデーションエンジン 1.2.2 クラスタ

    Mahoutイン・アクション
  • Apache Mahoutの使い方:テキスト分類のアルゴリズムを活用する

    ビッグデータ活用:その分析実装として注目されるMahout 長年蓄積した企業内データや、ソーシャルネットワークサービス、センサ端末から集められる膨大なデータを活用し、企業における利益向上やコスト削減などに活用する動きが活発になってきました。 データの分析手段として最近とみに注目されている技術として「機械学習」があります。大規模データの処理を得意とする大規模分散処理基盤「Apache Hadoop」の強みを生かし、簡単に機械学習を行うためのライブラリが、「Apache Mahout」(以下、Mahout)です。 稿ではMahoutを用いたデータ分析の例として「文書分類」を取り上げます。マシンを用いて分析実行する際の手順や陥りがちなポイント、チューニング方法の一例を紹介します。 Mahoutとは? MahoutとはApache Software Foundationが公開しているOSSの機械

    Apache Mahoutの使い方:テキスト分類のアルゴリズムを活用する
    kana321
    kana321 2014/03/04
    機械学習は古くからある情報処理のアルゴリズムの総称です。これをApache Hadoop上で実施する際のフレームワークの1つがApache Mahoutです
  • 1