タグ

Mahoutに関するyuu_kimyのブックマーク (2)

  • 試すのが難しい―機械学習の常識はMahoutで変わる

    ビッグデータ時代―なぜ、いま機械学習なのか Apache Hadoop(以下、Hadoop)の登場で、今まで捨てていたデータ、貯めるだけで処理しきれなかったデータを活用できるようになりました。 活用手段として最近とみに注目されている技術が「機械学習」であり、Hadoopの強みを生かし簡単に機械学習を行うためのライブラリが、「Apache Mahout」(以下、Mahout)です。 稿ではMahoutを動かしてみることで、機械学習の常識を身に付けます。 そもそも、機械学習とは? 機械学習とは、一定のデータをコンピュータ・プログラムに「学習」させ(すなわち、そのデータに潜むパターンや規則性を表す「モデル」を自動的に構築させ)、他のデータにそのモデルを適用すれば、あたかも人間のように複雑で柔軟な判断が行えるようにするという試みです。 機械学習をビジネスに活用した例は、レコメンド(ユーザーや商品

    試すのが難しい―機械学習の常識はMahoutで変わる
  • 第6回 「商品を買ってくれるのはどのような人か」を予測するには | gihyo.jp

    分類器を用いて予測モデルを構築する 「この商品を買ってくれるのはどのような人か?」 それを予測できれば、すべての顧客へ画一的にアプローチするのではなく、購入確率のより高い消費者を優先できるようになり、高い費用対効果が期待できます。 また、以下のような応用も期待できます。 「あなたにおすすめの商品」などのレコメンデーション機能を実現する 消費者に送信するDMに、その消費者が購入する確率の高い商品を優先していれる では、予測は機械学習を用いて、どのように実現するのでしょうか。 機械学習は、連載の第1回目でも取り上げたように、以下の2つに大別されます。 教師あり学習 教師なし学習 このうちの「教師あり学習」は、その手法から、さらにいくつかに分別されます。その中でもよく利用されるのが、分類器(Classification)と呼ばれる手法です。 分類器は、以下の手順でデータを分類します 事前に与え

    第6回 「商品を買ってくれるのはどのような人か」を予測するには | gihyo.jp
    yuu_kimy
    yuu_kimy 2013/08/15
    理論編と実践編に分けて、各テーマを説明してあり、かなり分かりやすい!!
  • 1