タイトル「mahout」を検索 - はてなブックマーク

1 - 40 件 / 219件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

mahoutの検索結果1 - 40 件 / 219件

試すのが難しい―機械学習の常識はMahoutで変わる
- 227 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2012/03/07
ビッグデータ時代―なぜ、いま機械学習なのか Apache Hadoop（以下、Hadoop）の登場で、今まで捨てていたデータ、貯めるだけで処理しきれなかったデータを活用できるようになりました。活用手段として最近とみに注目されている技術が「機械学習」であり、Hadoopの強みを生かし簡単に機械学習を行うためのライブラリが、「Apache Mahout」（以下、Mahout）です。本稿ではMahoutを動かしてみることで、機械学習の常識を身に付けます。そもそも、機械学習とは？機械学習とは、一定のデータをコンピュータ・プログラムに「学習」させ（すなわち、そのデータに潜むパターンや規則性を表す「モデル」を自動的に構築させ）、他のデータにそのモデルを適用すれば、あたかも人間のように複雑で柔軟な判断が行えるようにするという試みです。機械学習をビジネスに活用した例は、レコメンド（ユーザーや商品
- Mahout
- 機械学習
- hadoop
- ビッグデータ
- Java
- machine learning
- Apache
- bigdata
- machinelearning
- mapreduce
Apache Mahout - Overview
- 118 users
- mahout.apache.org
- テクノロジー
- 2009/05/04
For Creating Scalable Performant Machine Learning Applications Download Mahout Apache Mahout(TM) is a distributed linear algebra framework and mathematically expressive Scala DSL designed to let mathematicians, statisticians, and data scientists quickly implement their own algorithms. Apache Spark is the recommended out-of-the-box distributed back-end, or can be extended to other distributed backe
Amazon Elastic MapReduce入門〜 Apache Mahoutでレコメンデーション！ | DevelopersIO
- 109 users
- dev.classmethod.jp
- テクノロジー
- 2013/03/18
よく訓練されたアップル信者、都元です。Hadoop使ってますか。試しにHadoopを使ってみよう、と思った時に主に障害となるのが以下の3つです。 Hadoopのクラスタを組むために実機を複数用意するのが厄介。それをクラスタとして組み上げるのも厄介。 Hadoopの上で動かすアプリケーションをMapReduceで書くのが厄介。 Hadoopで処理するほどのビッグデータを用意するのが厄介。 1つ目はAmazon Elastic MapReduce (EMR)を使う事でスマートに解決しましょう。 2つ目については、オープンソースのMapReduceアプリケーションを使います。私が強い興味を持っている分野に「機械学習」というものがあります。機械学習とは、コンピュータにデータを分析させ、未知の情報についての予測をさせたり、人間の知能に近い機能を実現しようという試みです。今回は、この機械学習の各種アル
- Mahout
- hadoop
- aws
- EMR
- 機械学習
- MapReduce
- amazon
- Amazon EMR
Apache Mahoutの使い方：テキスト分類のアルゴリズムを活用する
- 95 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2013/12/04
ビッグデータ活用：その分析実装として注目されるMahout 長年蓄積した企業内データや、ソーシャルネットワークサービス、センサ端末から集められる膨大なデータを活用し、企業における利益向上やコスト削減などに活用する動きが活発になってきました。データの分析手段として最近とみに注目されている技術として「機械学習」があります。大規模データの処理を得意とする大規模分散処理基盤「Apache Hadoop」の強みを生かし、簡単に機械学習を行うためのライブラリが、「Apache Mahout」（以下、Mahout）です。本稿ではMahoutを用いたデータ分析の例として「文書分類」を取り上げます。マシンを用いて分析実行する際の手順や陥りがちなポイント、チューニング方法の一例を紹介します。 Mahoutとは？ MahoutとはApache Software Foundationが公開しているOSSの機械
Mahoutで体感する機械学習の実践記事一覧 | gihyo.jp
- 95 users
- gihyo.jp
- 学び
- 2013/01/29
第2回「ある商品といっしょによく売れる商品は何か？」を見つけるには　～マーケット・バスケット分析の考え方やまかつ 2013-03-06
Apache Mahout - Overview
- 94 users
- mahout.apache.org
- 暮らし
- 2008/02/04
For Creating Scalable Performant Machine Learning Applications Download Mahout Apache Mahout(TM) is a distributed linear algebra framework and mathematically expressive Scala DSL designed to let mathematicians, statisticians, and data scientists quickly implement their own algorithms. Apache Spark is the recommended out-of-the-box distributed back-end, or can be extended to other distributed backe
大規模データマイニング・機械学習 Mahout 活用に向けて読んでおきたい12のプレゼン資料 - hamadakoichi blog
- 83 users
- hamadakoichi.hatenadiary.org
- テクノロジー
- 2012/05/04
2012年度が始まり1ヶ月が経ちました。2011年度は、大規模分散処理技術・データ基盤の普及が広く進んだ年だったと思います。2012年はそれら蓄積された大規模データを活用しデータマイニング・機械学習を用い、ビジネス・サービス洗練を大きく広げていく年ではないでしょうか。 Mahoutは大規模分散データマイニング・機械学習のライブラリです。ApacheプロジェクトのOpen Sourceで、Hadoop上で動作しデータマイニング・機械学習の大規模分散実行を行うことができます。 Apache Mahout 大規模分散データマイニング・機械学習を実行できる Mahout ですが、まだ「ドキュメント整備が発展途上で詳細を知るためにはソースコードから読み解く」必要がある場合が多く、また、活用には「対象とするデータマイニング・機械学習の基礎知識」が必要なため、まだまだ活用の敷居が高いのが現状ではない
InfoQ: Apache Mahout: 拡張性の高い機械学習アルゴリズム
- 73 users
- www.infoq.com
- 暮らし
- 2009/05/01
Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...
Apache Mahoutで機械学習してみるべ - 都元ダイスケ IT-PRESS
- 66 users
- daisuke-m.hatenablog.com
- 暮らし
- 2011/03/10
Mahoutシリーズ目次（随時更新）非分散レコメンデーション Apache Mahoutで機械学習してみるべ - 都元ダイスケ IT-PRESS （これ）レコメンデーションの簡単な原理を視覚的に把握してから実際に計算してみる - 都元ダイスケ IT-PRESS 機械学習における重大な"仮定"と、アルゴリズムの評価 - 都元ダイスケ IT-PRESS 分散レコメンデーション Mahoutで分散レコメンド(1) - 都元ダイスケ IT-PRESS Mahoutで分散レコメンド(2) - 都元ダイスケ IT-PRESS Mahoutで分散レコメンド(3) - 都元ダイスケ IT-PRESS クラスタリング今度はMahoutでクラスタリング - 都元ダイスケ IT-PRESS 今度はMahoutでクラスタリング(ソース編) - 都元ダイスケ IT-PRESS では、本文いきます。 Apach
- Mahout
- 機械学習
- hadoop
- apache
- レコメンデーション
- java
- oss
Mahout JP - #MahoutJP
- 63 users
- sites.google.com
- テクノロジー
- 2011/05/01
Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode
あしたのオープンソース研究所 - CouchDB Eucalyptus Hadoop Factor Endian-Firewall GStreamer ]project-open[ SeleniumHQ jQuery Cassandra ZooKeeper HBase Scala Lift Moses Neo4j Gephi Mahout MyFaces S4 James Ruby on Rails OpenLayers MongoDB Mapnik Flume UIMA Solr Friendica R
- 59 users
- oss.infoscience.co.jp
- テクノロジー
- 2009/11/26
あしたのオープンソース研究所では、これから注目されるであろう海外のオープンソースソフトウェアを発見し、サイトを日本語訳することで、みなさまにいち早くご紹介いたします。 2012/08/06 reactive-web の翻訳コンテンツをアップしました。 2012/07/24 「あしたの研について」と「運営会社」のページを更新しました。 2012/07/05 Red5 の翻訳コンテンツ (第2弾) をアップしました。 2012/06/06 Red5 の翻訳コンテンツをアップしました。 2012/06/04 Red5 の座談会資料を SlideShare に掲載しました。 2012/05/07 Friendica の翻訳コンテンツをアップしました。 2012/04/04 Apache UIMA の翻訳コンテンツをアップしました。 2012/03/07 Friendica の座談会資料を Slid
- OSS
- オープンソース
- opensource
- 翻訳
- まとめ
- hadoop
- code
Apache Mahout 機械学習Libraryを使って「魔法少女まどか☆マギカ」の台詞をテキストマイニングしてみた - Y's note
- 56 users
- yut.hatenablog.com
- テクノロジー
- 2012/05/04
Mahout in Action 作者: Sean Owen,Robin Anil,Ted Dunning,Ellen Friedman出版社/メーカー: Manning Pubns Co発売日: 2011/10/28メディア: ペーパーバック購入: 4人クリック: 81回この商品を含むブログ (10件) を見る Index Information & Links Apache Mahout Abouc Apache Mahout Mahout has machine learning libraries Mahout Download / Setting Madmagi Words Scraping Word MA Mecab MA HDFS PUT Clustering Theory TF/IDF K-Means Canopy Clustering Word Vector Clust
あしたのオープンソース研究所 - CouchDB Eucalyptus Hadoop Factor Endian-Firewall GStreamer ]project-open[ SeleniumHQ jQuery Cassandra ZooKeeper HBase Scala Lift Moses Neo4j Gephi Mahout MyFaces S4 James Ruby on Rails OpenLayers MongoDB Mapnik Flume UIMA Solr Friendica R
- 51 users
- oss.infoscience.co.jp
- テクノロジー
- 2009/11/27
あしたのオープンソース研究所では、これから注目されるであろう海外のオープンソースソフトウェアを発見し、サイトを日本語訳することで、みなさまにいち早くご紹介いたします。 2012/08/06 reactive-web の翻訳コンテンツをアップしました。 2012/07/24 「あしたの研について」と「運営会社」のページを更新しました。 2012/07/05 Red5 の翻訳コンテンツ (第2弾) をアップしました。 2012/06/06 Red5 の翻訳コンテンツをアップしました。 2012/06/04 Red5 の座談会資料を SlideShare に掲載しました。 2012/05/07 Friendica の翻訳コンテンツをアップしました。 2012/04/04 Apache UIMA の翻訳コンテンツをアップしました。 2012/03/07 Friendica の座談会資料を Slid
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference Japan 2014
- 44 users
- www.slideshare.net/MapR_Japan
- アニメとゲーム
- 2014/07/09
機械学習は、増え続けるデータをもとに、事業戦略の判断やより正確な予測、関連性の推定を行うための、重要なツールです。機械学習の中でも、最も幅広く活用されているアプリケーションはレコメンデーションエンジンです。スケーラブルな機械学習ライブラリであるMahoutは、レコメンデーションの生成とデータの扱いをシンプルなものにしてくれます。本講演では、より構築が簡単なレコメンデーションエンジンのデザインと、そのイノベーティブな実装方法を活用した場合の利点を紹介します。2014年7月8日に開催されたHadoop Conference Japan 2014での講演資料です。
- mahout
- recommendation
- 機械学習
- solr
- hadoop
Hadoop上で動く機械学習ライブラリ　「Apache Mahout 0.1」リリース
- 41 users
- codezine.jp
- 暮らし
- 2009/04/10
CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。
EMR上でMahoutを使ってレコメンデーション | DevelopersIO
- 40 users
- dev.classmethod.jp
- テクノロジー
- 2014/09/05
7月にAWS Big Data Blogというブログが始まったのですが、最初の記事がBuilding a Recommender with Apache Mahout on Amazon Elastic MapReduce (EMR)というタイトルでEMR上でMahoutを使ってレコメンデーションを行ってみるというものでした。EMR上でMahoutというと既にAmazon Elastic MapReduce入門〜 Apache Mahoutでレコメンデーション！というエントリーがありますが、こちらはAmazon EMR CLIを使っていることもあり、ブログにしてみました。 Building a Recommender with Apache Mahout on Amazon Elastic MapReduce (EMR)についてまず機械学習の概要について説明した上でMahoutを使って
- mahout
- emr
- AWS
- 機械学習
- Amazon
- 開発
- development
Mahoutイン・アクション
- 39 users
- www.oreilly.co.jp
- テクノロジー
- 2012/10/12
Apacheプロジェクトが提供するオープンソースの機械学習ライブラリ、Mahoutについて包括的に解説する書籍です。協調フィルタリングによるレコメンデーションについて、オンメモリ実装からHadoopベースの並列実装までを説明することで、分散環境における機械学習アルゴリズムの全体像を明らかにします。また、データの中で似た者同士をクラスタにグループ化するクラスタリングアルゴリズムに触れ、さらに分類器の構築、サンプルデータを使って「学習」させる方法を説明します。実装例を示しながら実践的に解説する本書は、Mahoutをマスターしたいエンジニア必携の一冊です。訳者による日本語版サポートページ序文訳者まえがきはじめに 1章　Apache Mahoutへようこそ 1.1　Mahoutものがたり 1.2　Mahoutが扱う機械学習の分野 1.2.1　レコメンデーションエンジン 1.2.2　クラスタ
- mahout
- 機械学習
- hadoop
- book
- O'Reilly
- machineLearning
- Apache
- programming
- 本
はじめてでもわかるベイズ分類器－基礎からMahout実装まで－
- 38 users
- www.slideshare.net/yanaoki
- テクノロジー
- 2010/09/26
A Speculative Technique for Auto-Memoization Processor with MultithreadingMatsuo and Tsumura lab.
- mahout
- algorithm
- ベイズ
- bayesian
- 資料
- アルゴリズム
- 機械学習
- mining
- *まとめ
mahout/レコメンドシステムの作り方 - PukiWiki
- 35 users
- www.pwv.co.jp/~take
- テクノロジー
- 2010/04/30
プロジェクトの作成 † mavenを使ってレコメンド・アプリケーションを作成します。最初に、プロジェクトを作成します。 $ mvn archetype:create -DgroupId=sample.recommendApp -DartifactId=recommendApp -Dversion=0.0.1 ↑ pomファイルの変更 † pom.xmlのdependecyに以下の項目を追加します。 <dependency> <groupId>org.apache.mahout</groupId> <artifactId>mahout-core</artifactId> <version>0.2</version> </dependency> <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-jcl</artifactI
Mahout 0.3: オープンソースの機械学習プロジェクト
- 33 users
- www.infoq.com
- 暮らし
- 2010/04/26
Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...
Perl で MapReduce - Mahout Frequent Pattern Mining Data - - hamadakoichi blog
- 31 users
- hamadakoichi.hatenadiary.org
- テクノロジー
- 2011/05/17
最近、Perl も書き始めてみたので、Hadoop 上で分散実行できる Perl での MapReduce 実装を紹介する。大規模データマイニング・機械学習のライブラリ Apache Mahout の Parallel Frequent Pattern Mining の入力データを生成する Perl MapReduce 実装の紹介。 Frequent Pattern Mining 入門 Frequent Pattern Mining (Association Analysis )は、隠されたルールパターンを抽出するアルゴリズム。有名な例としては、1992年のウォルマートのクリスマス商戦で「おむつを買った人は半ダースのビールを買う可能性が最も高い」という頻出ルールを抽出し、商品陳列に活かした売上向上した事例。入門資料：第５回R勉強会＠東京で話してきた - 「R言語によるアソシエーション
- hadoop
- perl
- MapReduce
- Mahout
- データマイニング
- data
- あとで読む
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
- 29 users
- www.slideshare.net/slideshow
- テクノロジー
- 2011/12/29
「Mobageの大規模データマイニング」PRMU 2011 Big Data and Cloud で講演してきました http://d.hatena.ne.jp/hamadakoichi/20111229/p1Read less
- DeNA
- datamining
- hadoop
- 機械学習
- データマイニング
- 統計
- slide
- data
- social
Mahout in Action
- 27 users
- www.manning.com
- テクノロジー
- 2009/12/29
pro $24.99 per month access to all Manning books, MEAPs, liveVideos, liveProjects, and audiobooks! share your subscription with another person choose one free eBook per month to keep exclusive 50% discount on all purchases lite $19.99 per month access to all Manning books, including MEAPs! team 5, 10 or 20 seats+ for your team - learn more
- mahout
- hadoop
- book
- 機械学習
Mahout使って分析しちゃいました。
- 27 users
- enterprisezine.jp
- テクノロジー
- 2013/04/24
EnterpriseZine（エンタープライズジン）編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。
AppEngineでMahoutを使ったレコメンド機能を作ってみた - Orfeon Blog
- 25 users
- orfeon.hatenablog.com
- テクノロジー
- 2012/07/01
Apache Mahoutは様々な機械学習・データマイニング手法を、Hadoopを利用してスケーラブルに取り扱うことができるライブラリなのですが、ちょっとしたレコメンド機能の開発にも手軽に利用することができます。今回は自分用の備忘録も兼ねてAppEngine/Javaでの利用実例を紹介してみたいと思います。やったこと先日リリースした漫画の読書管理Webサービス「コミックライブラリー(コミ蔵)」で漫画の関連シリーズのレコメンド機能を作成しました。Amazonとかでよくある商品の関連アイテムのレコメンドです。利用するユースケースやデータ量にもよりますが、意外と簡単にAppEngine上のサービスで推薦機能を使えるようになりました。実行構成レコメンド機能の実行の流れは下記の通り。レコメンド機能を実装したServletをcronで1週間に1回、Backend Instance上で実行。
Mahoutを使ったNaiveBayesによる機械学習 - Y's note
- 24 users
- yut.hatenablog.com
- テクノロジー
- 2012/11/14
入門ソーシャルデータ ―データマイニング、分析、可視化のテクニック作者: Matthew A. Russell,奥野陽（監訳）,佐藤敏紀（監訳）,瀬戸口光宏（監訳）,原川浩一（監訳）,水野貴明（監訳）,長尾高弘出版社/メーカー: オライリージャパン発売日: 2011/11/26メディア: 大型本購入: 18人クリック: 779回この商品を含むブログ (42件) を見る BigDataでの機械学習膨大なデータに対して機械学習を行いたい時にlocalの端末一台では処理の時間が掛かりすぎてしまいます。学習、モデル作成、予測のそれぞれの処理を高速で行うための一つのSolutionがHadoop上で機械学習をしてしまうことだと思います。Hadoop上で機械学習をするための便利なライブラリとしてJAVAベースのMahoutがあります。この記事ではMahoutによるNaiveBayes分類学習を
- mahout
- NaiveBayes
- 機械学習
- hadoop
- 数学
- python
Mahout の開発環境を Maven+Eclipse で作る (1) - 木曜不足
- 24 users
- shuyo.hatenablog.com
- テクノロジー
- 2011/01/31
Mahout in Action 買ったんだけど、開発環境の作り方についてはほとんど何も書いてない。いや、それも大事なことだと思うぞ。というわけで、Mahout 用の開発環境をちょっとまじめに作ってみた。とりあえず今回は Mahout in Action のサンプルコードを Eclipse 上で動かすところまで。いろいろインストール必要なものをインストール。今回入れたのはこんな感じ。それぞれの入れ方は略。まあ JAVA_HOME を設定して、パスを通すぐらい。 OS が Windows 2008 x64 なので、Java と Eclipse は x64 版を入れている。 Cygwin Java SDK 6u23 x64 Eclipse 3.6(helios) SR1 x64 Maven 3.0.2 (Hadoop 0.21.0 0.20.2) Cygwin は Mahout が D
- mahout
- hadoop
- eclipse
- 機械学習
- maven
- Java
- あとで読む
第3回　Mahoutの環境構築とFP-Growthによるマーケットバスケット分析 | gihyo.jp
- 22 users
- gihyo.jp
- テクノロジー
- 2013/04/04
HadoopとMahoutをインストールする Hadoopのバージョンに注意前回はマーケットバスケット分析の理論編として、アソシエーション分析とアプリオリアルゴリズムについて解説しました。今回は実践編として、Mahoutが実装しているアプリオリアルゴリズムを改良したFP-Growthを用いて、実際にマーケットバスケット分析を行ってみましょう。そのための準備として、まずMahoutとHadoopをインストールする必要がありますが、その際1つ注意する点があります。現在のMahoutの最新バージョンである0.7は、利用するHadoopのバージョンが0.20系である必要があります。しかし、Apacheの公式サイトからはすでにHadoopのバージョン0.20をダウンロードすることはできません。 Hadoopのバージョン0.20をお持ちでない方は、Cloudera社のページからダウンロードするこ
Mahout RandomForest Driver 実装法 -大規模分散機械学習・判別 - - hamadakoichi blog
- 21 users
- hamadakoichi.hatenadiary.org
- 暮らし
- 2011/05/07
Apache Mahout は、Hadoop上で動作する大規模分散データマイニング・機械学習のライブラリ。 Random Forest は大規模データで高精度の分類・判別を実現するアルゴリズム。 Random Forestを、"R言語での実行のように容易"に "大規模分散学習・判別"できるように、 Mahout を用いた各種 Driver を実装しました。以下に実行方法、実装を紹介します。 org.mahoutjp.df.ForestDriver Random Forest の分散学習から、分散判別、判別結果出力、および、精度評価まで行う Driver。 org.mahoutjp.df.ForestClassificationDriver 生成された Forest Modelを用いて、分散判別、判別結果出力、および、精度評価まで行う Driver。両 Driver とも、1コマンドで
機械学習/MacでMahoutを使う - とうごろうぃき
- 21 users
- xn--p8ja5bwe1i.jp
- テクノロジー
- 2011/03/05
2011-02-19 (土) 15:28:21 (4847d) | Topic path: Top / 機械学習 / MacでMahoutを使うはじめに † Apache Mahoutは，分散環境Hadoopの上で動くスケーラブルな機械学習ライブラリーです．ただし，「Hadoop上でMapReduceを使った機械学習をやりたい」という強い意思がないと，サンプルを動かして終わりになります．「別にMapReduceでなくてもいい」という人は，別のツールを使ったほうがいいでしょう．この記事の内容は，Mac OS X 10.6.6, Hadoop 0.20.2, Maven 3.0.2, Mahout 0.40で確認しました． ↑ 必要なもの † Java SE 1.6 Mac OS X 10.6.6には標準でJava SE (JDK) 1.6が入っていると思います．ユーティリティーにあ
- mahout
- hadoop
- 機械学習
- mac
- ブックマークバー
- Java
Mahoutにパッチを送ってみた
- 20 users
- www.slideshare.net/issaymk2
- テクノロジー
- 2011/12/10
実践・最強最速のアルゴリズム勉強会第二回講義資料(ワークスアプリケーションズ & AtCoder)AtCoder Inc.31.1K views•107 slides
Mahout の開発環境を Maven+Eclipse で作る (3) Eclipse で Hadoop の開発環境を作る - 木曜不足
- 19 users
- shuyo.hatenablog.com
- テクノロジー
- 2011/02/18
Mahout の、と言いつつ今回も Hadoop の話ばかり。 Hadoop は各ノードにアプリケーションを配布する関係から、通常 jar を作らなければならない。そのため、Eclipse で書いたコードを実行するのもデバッグするのも非常にめんどくさい。でもうまくやれば、スタンドアローンモード限定だが、Eclipse から jar も作らずそのまま Map-Reduce ジョブを起動できる。デバッグ実行もできるので、ブレイクポイント入れてステップ実行とかも可能だ。今回はそういう環境の作り方の話。ずいぶん苦労したけど、出来るようになったら簡単。 Eclipse のセットアップなどは済んでいるものとする。Mahout の開発環境を Maven+Eclipse で作る (1) - Mi manca qualche giovedi`? 参照。なお、Hadoop を展開すると contrib/
- hadoop
- mahout
- eclipse
- programming
- 機械学習
- tutorial
Mahout Programming : K-Means Clustering - hamadakoichi blog
- 18 users
- hamadakoichi.hatenadiary.org
- テクノロジー
- 2010/07/19
Mahout でのデータマイニング。mahout.clustering.kmeans を使ったクラスター分析を実装してみた。Mahoutは、Hadoop上で動くデータマイニング・機械学習の各種アルゴリズムが実装されているライブラリ。クラスター分析クラスター分析の方法論自体の内容は以下のエントリにまとめてある。 R言語プログラミング：クラスター分析 - 階層的クラスタリング - hamadakoichi blog 第２回データマイニング+WEB 勉強会＠東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」 - hamadakoichi blog 第３回データマイニング+WEB 勉強会＠東京 (Tokyo.Webmining#3) を開催します - hamadakoichi blog R言語プログラミング：クラスター分析
- mahout
- k-means
- hadoop
Apache Mahout - Random Forests - #TokyoWebmining #8
- 18 users
- www.slideshare.net/hamadakoichi
- テクノロジー
- 2010/11/14
Koichi HamadaSenior Staff Research Engineer, Artificial Intelligence at DeNA
- mahout
- algorithm
第11回データマイニング+WEB 勉強会＠東京( #TokyoWebmining 11th) －Mahout・Graphical Model・学術祭り－を開催しました - hamadakoichi blog
- 17 users
- hamadakoichi.hatenadiary.org
- 暮らし
- 2011/06/12
2011/06/12 "第11回データマイニング+WEB 勉強会＠東京−Mahout・Graphical Model・学術祭り−"を開催しました。第11回データマイニング+WEB 勉強会＠東京　( #TokyoWebmining 11th)−Mahout・Graphical Model・学術祭り−: Eventbrite Google グループ会場提供し運営を手伝って下さったニフティ株式会社のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。参加者一覧：以下、全講師資料、関連資料、ツイートまとめです。 AGENDA： ■Opening Talk： O1.「データマイニング+WEB勉強会＠東京について」(10分) 講師： id:hamadakoichi
Mahout Canopy Clustering - #TokyoWebmining 9
- 17 users
- www.slideshare.net/hamadakoichi
- テクノロジー
- 2011/01/16
Koichi HamadaSenior Staff Research Engineer, Artificial Intelligence at DeNA
- mahout
- hadoop
- clustering
- DataMining
- *あとで読む
- canopy
Apache Mahout お手軽レコメンド
- 17 users
- www.slideshare.net/yosshi1202
- テクノロジー
- 2012/11/22
SQL Server 2017 Machine Learning Services (CLR-H in TOKYO #13)Tomoyuki Oota
Mahoutのseqdirectoryとseq2sparseを使って文書クラスタリング | mwSoft
- 17 users
- www.mwsoft.jp
- テクノロジー
- 2012/08/30
概要 Mahoutのexamples/binの下には、cluster-reuters.shというロイターの記事をクラスタリングする処理を実演してくれるシェルがいる。このシェルでは、seqdirectoryとseq2sparseという2つのコマンドを使って、テキスト文書をVectorに変換している。これを参考にして、青空文庫から取ってきたいくつかの文書をクラスタリングして遊んでみる。 Mahoutのバージョンは0.7。 bin/mahout seqdirectoryは、テキストファイルの入ったディレクトリから、シーケンスファイルを生成する。とりあえず下記のようなテキストファイルを適当なディレクトリ（仮に/tmp/tekitou/sample.txtとする）に入れて、実行してみる。我輩はプログラマである。仕事はしていない。ファイルはHDFSに置く。 $ hadoop fs -put
- mahout
- hadoop
- clustering
- 機械学習
Mahout Recommendation - #TokyoWebmining 14th
- 16 users
- www.slideshare.net/hamadakoichi
- テクノロジー
- 2011/10/16
Koichi HamadaSenior Staff Research Engineer, Artificial Intelligence at DeNA
Mahout JP を立ち上げました #MahoutJP - hamadakoichi blog
- 16 users
- hamadakoichi.hatenadiary.org
- テクノロジー
- 2011/05/02
Hadoop上で動作する大規模データマイニング・機械学習ライブラリ Apache Mahout に関し、技術情報まとめ・発信よる活用の裾野を広げることを目的としMahout JPを立ち上げました。私も含め TokyoWebminingでMahoutに関する各種講師をしていたメンバーや、Tokyo.R、PRML会のメンバー含め、各業界のデータマイニング・機械学習で活動してきたメンバーで集まり、Mahoutに関する情報まとめ・発信をしていきます。 Mahout JP -Effective Applications of Apache Mahout in Japan- #MahoutJP 現在、Mahout はドキュメントがまだ整備されていなく、唯一ある書籍 Mahout in Actionでも情報が限られているため、実際に活用しようとするとソースコードから読み込む必要がある状態です。今回、