並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 135件

新着順 人気順

mahoutの検索結果1 - 40 件 / 135件

  • 試すのが難しい―機械学習の常識はMahoutで変わる

    ビッグデータ時代―なぜ、いま機械学習なのか Apache Hadoop(以下、Hadoop)の登場で、今まで捨てていたデータ、貯めるだけで処理しきれなかったデータを活用できるようになりました。 活用手段として最近とみに注目されている技術が「機械学習」であり、Hadoopの強みを生かし簡単に機械学習を行うためのライブラリが、「Apache Mahout」(以下、Mahout)です。 本稿ではMahoutを動かしてみることで、機械学習の常識を身に付けます。 そもそも、機械学習とは? 機械学習とは、一定のデータをコンピュータ・プログラムに「学習」させ(すなわち、そのデータに潜むパターンや規則性を表す「モデル」を自動的に構築させ)、他のデータにそのモデルを適用すれば、あたかも人間のように複雑で柔軟な判断が行えるようにするという試みです。 機械学習をビジネスに活用した例は、レコメンド(ユーザーや商品

      試すのが難しい―機械学習の常識はMahoutで変わる
    • Apache Mahout - Overview

      For Creating Scalable Performant Machine Learning Applications Download Mahout Apache Mahout(TM) is a distributed linear algebra framework and mathematically expressive Scala DSL designed to let mathematicians, statisticians, and data scientists quickly implement their own algorithms. Apache Spark is the recommended out-of-the-box distributed back-end, or can be extended to other distributed backe

      • Amazon Elastic MapReduce入門 〜 Apache Mahoutでレコメンデーション! | DevelopersIO

        よく訓練されたアップル信者、都元です。Hadoop使ってますか。試しにHadoopを使ってみよう、と思った時に主に障害となるのが以下の3つです。 Hadoopのクラスタを組むために実機を複数用意するのが厄介。それをクラスタとして組み上げるのも厄介。 Hadoopの上で動かすアプリケーションをMapReduceで書くのが厄介。 Hadoopで処理するほどのビッグデータを用意するのが厄介。 1つ目はAmazon Elastic MapReduce (EMR)を使う事でスマートに解決しましょう。 2つ目については、オープンソースのMapReduceアプリケーションを使います。私が強い興味を持っている分野に「機械学習」というものがあります。機械学習とは、コンピュータにデータを分析させ、未知の情報についての予測をさせたり、人間の知能に近い機能を実現しようという試みです。今回は、この機械学習の各種アル

          Amazon Elastic MapReduce入門 〜 Apache Mahoutでレコメンデーション! | DevelopersIO
        • Apache Mahoutの使い方:テキスト分類のアルゴリズムを活用する

          ビッグデータ活用:その分析実装として注目されるMahout 長年蓄積した企業内データや、ソーシャルネットワークサービス、センサ端末から集められる膨大なデータを活用し、企業における利益向上やコスト削減などに活用する動きが活発になってきました。 データの分析手段として最近とみに注目されている技術として「機械学習」があります。大規模データの処理を得意とする大規模分散処理基盤「Apache Hadoop」の強みを生かし、簡単に機械学習を行うためのライブラリが、「Apache Mahout」(以下、Mahout)です。 本稿ではMahoutを用いたデータ分析の例として「文書分類」を取り上げます。マシンを用いて分析実行する際の手順や陥りがちなポイント、チューニング方法の一例を紹介します。 Mahoutとは? MahoutとはApache Software Foundationが公開しているOSSの機械

            Apache Mahoutの使い方:テキスト分類のアルゴリズムを活用する
          • Mahoutで体感する機械学習の実践 記事一覧 | gihyo.jp

            第2回「ある商品といっしょによく売れる商品は何か?」を見つけるには ~マーケット・バスケット分析の考え方 やまかつ 2013-03-06

              Mahoutで体感する機械学習の実践 記事一覧 | gihyo.jp
            • Apache Mahout - Overview

              For Creating Scalable Performant Machine Learning Applications Download Mahout Apache Mahout(TM) is a distributed linear algebra framework and mathematically expressive Scala DSL designed to let mathematicians, statisticians, and data scientists quickly implement their own algorithms. Apache Spark is the recommended out-of-the-box distributed back-end, or can be extended to other distributed backe

              • 大規模データマイニング・機械学習 Mahout 活用に向けて読んでおきたい12のプレゼン資料 - hamadakoichi blog

                2012年度が始まり1ヶ月が経ちました。2011年度は、大規模分散処理技術・データ基盤の普及が広く進んだ年だったと思います。2012年はそれら蓄積された大規模データを活用しデータマイニング・機械学習を用い、ビジネス・サービス洗練を大きく広げていく年ではないでしょうか。 Mahoutは 大規模分散データマイニング・機械学習のライブラリです。ApacheプロジェクトのOpen Sourceで、Hadoop上で動作しデータマイニング・機械学習の大規模分散実行を行うことができます。 Apache Mahout 大規模分散 データマイニング・機械学習を実行できる Mahout ですが、まだ「ドキュメント整備が発展途上で詳細を知るためにはソースコードから読み解く」必要がある場合が多く、また、活用には「対象とするデータマイニング・機械学習の基礎知識」が必要なため、まだまだ活用の敷居が高いのが現状ではない

                  大規模データマイニング・機械学習 Mahout 活用に向けて読んでおきたい12のプレゼン資料 - hamadakoichi blog
                • InfoQ: Apache Mahout: 拡張性の高い機械学習アルゴリズム

                  垂直スケーラビリティと効果的なテストによる金融取引システムのパフォーマンスと効率の最大化 Peter Lawrey氏はJavaチャンピオンであり、Chronicle SoftwareのCEOとして、開発者を鼓舞してソリューションのクラフトマンシップを高めることに情熱を注いでいる。経験豊富なソフトウェアエンジニアとして、Lawrey氏はソフトウェア開発プロセスにおけるシンプルさ、パフォーマンス、創造性、革新性を奨励することに努めている。

                    InfoQ: Apache Mahout: 拡張性の高い機械学習アルゴリズム
                  • Apache Mahoutで機械学習してみるべ - 都元ダイスケ IT-PRESS

                    Mahoutシリーズ目次(随時更新) 非分散レコメンデーション Apache Mahoutで機械学習してみるべ - 都元ダイスケ IT-PRESS (これ) レコメンデーションの簡単な原理を視覚的に把握してから実際に計算してみる - 都元ダイスケ IT-PRESS 機械学習における重大な"仮定"と、アルゴリズムの評価 - 都元ダイスケ IT-PRESS 分散レコメンデーション Mahoutで分散レコメンド(1) - 都元ダイスケ IT-PRESS Mahoutで分散レコメンド(2) - 都元ダイスケ IT-PRESS Mahoutで分散レコメンド(3) - 都元ダイスケ IT-PRESS クラスタリング 今度はMahoutでクラスタリング - 都元ダイスケ IT-PRESS 今度はMahoutでクラスタリング(ソース編) - 都元ダイスケ IT-PRESS では、本文いきます。 Apach

                      Apache Mahoutで機械学習してみるべ - 都元ダイスケ IT-PRESS
                    • Mahout JP - #MahoutJP

                      Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

                      • あしたのオープンソース研究所 - CouchDB Eucalyptus Hadoop Factor Endian-Firewall GStreamer ]project-open[ SeleniumHQ jQuery Cassandra ZooKeeper HBase Scala Lift Moses Neo4j Gephi Mahout MyFaces S4 James Ruby on Rails OpenLayers MongoDB Mapnik Flume UIMA Solr Friendica R

                        あしたのオープンソース研究所では、これから注目されるであろう海外のオープンソースソフトウェアを発見し、サイトを日本語訳することで、みなさまにいち早くご紹介いたします。 2012/08/06 reactive-web の翻訳コンテンツをアップしました。 2012/07/24 「あしたの研について」と「運営会社」のページを更新しました。 2012/07/05 Red5 の翻訳コンテンツ (第2弾) をアップしました。 2012/06/06 Red5 の翻訳コンテンツをアップしました。 2012/06/04 Red5 の座談会資料を SlideShare に掲載しました。 2012/05/07 Friendica の翻訳コンテンツをアップしました。 2012/04/04 Apache UIMA の翻訳コンテンツをアップしました。 2012/03/07 Friendica の座談会資料を Slid

                        • Apache Mahout 機械学習Libraryを使って「魔法少女まどか☆マギカ」の台詞をテキストマイニングしてみた - Y's note

                          Mahout in Action 作者: Sean Owen,Robin Anil,Ted Dunning,Ellen Friedman出版社/メーカー: Manning Pubns Co発売日: 2011/10/28メディア: ペーパーバック購入: 4人 クリック: 81回この商品を含むブログ (10件) を見る Index Information & Links Apache Mahout Abouc Apache Mahout Mahout has machine learning libraries Mahout Download / Setting Madmagi Words Scraping Word MA Mecab MA HDFS PUT Clustering Theory TF/IDF K-Means Canopy Clustering Word Vector Clust

                            Apache Mahout 機械学習Libraryを使って「魔法少女まどか☆マギカ」の台詞をテキストマイニングしてみた - Y's note
                          • あしたのオープンソース研究所 - CouchDB Eucalyptus Hadoop Factor Endian-Firewall GStreamer ]project-open[ SeleniumHQ jQuery Cassandra ZooKeeper HBase Scala Lift Moses Neo4j Gephi Mahout MyFaces S4 James Ruby on Rails OpenLayers MongoDB Mapnik Flume UIMA Solr Friendica R

                            あしたのオープンソース研究所では、これから注目されるであろう海外のオープンソースソフトウェアを発見し、サイトを日本語訳することで、みなさまにいち早くご紹介いたします。 2012/08/06 reactive-web の翻訳コンテンツをアップしました。 2012/07/24 「あしたの研について」と「運営会社」のページを更新しました。 2012/07/05 Red5 の翻訳コンテンツ (第2弾) をアップしました。 2012/06/06 Red5 の翻訳コンテンツをアップしました。 2012/06/04 Red5 の座談会資料を SlideShare に掲載しました。 2012/05/07 Friendica の翻訳コンテンツをアップしました。 2012/04/04 Apache UIMA の翻訳コンテンツをアップしました。 2012/03/07 Friendica の座談会資料を Slid

                            • 実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference Japan 2014

                              機械学習は、増え続けるデータをもとに、事業戦略の判断やより正確な予測、関連性の推定を行うための、重要なツールです。機械学習の中でも、最も幅広く活用されているアプリケーションはレコメンデーションエンジンです。スケーラブルな機械学習ライブラリであるMahoutは、レコメンデーションの生成とデータの扱いをシンプルなものにしてくれます。本講演では、より構築が簡単なレコメンデーションエンジンのデザインと、そのイノベーティブな実装方法を活用した場合の利点を紹介します。2014年7月8日に開催されたHadoop Conference Japan 2014での講演資料です。

                                実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference Japan 2014
                              • Hadoop上で動く機械学習ライブラリ 「Apache Mahout 0.1」リリース

                                CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

                                  Hadoop上で動く機械学習ライブラリ 「Apache Mahout 0.1」リリース
                                • EMR上でMahoutを使ってレコメンデーション | DevelopersIO

                                  7月にAWS Big Data Blogというブログが始まったのですが、最初の記事がBuilding a Recommender with Apache Mahout on Amazon Elastic MapReduce (EMR)というタイトルでEMR上でMahoutを使ってレコメンデーションを行ってみるというものでした。EMR上でMahoutというと既にAmazon Elastic MapReduce入門 〜 Apache Mahoutでレコメンデーション!というエントリーがありますが、こちらはAmazon EMR CLIを使っていることもあり、ブログにしてみました。 Building a Recommender with Apache Mahout on Amazon Elastic MapReduce (EMR)について まず機械学習の概要について説明した上でMahoutを使って

                                    EMR上でMahoutを使ってレコメンデーション | DevelopersIO
                                  • Mahoutイン・アクション

                                    Apacheプロジェクトが提供するオープンソースの機械学習ライブラリ、Mahoutについて包括的に解説する書籍です。協調フィルタリングによるレコメンデーションについて、オンメモリ実装からHadoopベースの並列実装までを説明することで、分散環境における機械学習アルゴリズムの全体像を明らかにします。また、データの中で似た者同士をクラスタにグループ化するクラスタリングアルゴリズムに触れ、さらに分類器の構築、サンプルデータを使って「学習」させる方法を説明します。実装例を示しながら実践的に解説する本書は、Mahoutをマスターしたいエンジニア必携の一冊です。 訳者による日本語版サポートページ 序文 訳者まえがき はじめに 1章 Apache Mahoutへようこそ 1.1 Mahoutものがたり 1.2 Mahoutが扱う機械学習の分野 1.2.1 レコメンデーションエンジン 1.2.2 クラスタ

                                      Mahoutイン・アクション
                                    • はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-

                                      A Speculative Technique for Auto-Memoization Processor with MultithreadingMatsuo and Tsumura lab.

                                        はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
                                      • mahout/レコメンドシステムの作り方 - PukiWiki

                                        プロジェクトの作成 † mavenを使ってレコメンド・アプリケーションを作成します。 最初に、プロジェクトを作成します。 $ mvn archetype:create -DgroupId=sample.recommendApp -DartifactId=recommendApp -Dversion=0.0.1 ↑ pomファイルの変更 † pom.xmlのdependecyに以下の項目を追加します。 <dependency> <groupId>org.apache.mahout</groupId> <artifactId>mahout-core</artifactId> <version>0.2</version> </dependency> <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-jcl</artifactI

                                        • Mahout 0.3: オープンソースの機械学習プロジェクト

                                          Rustが再評価される:エコシステムの現状と落とし穴 In this article, we share findings and insights about the Rust community and ecosystem and elaborate on the peculiarities and pitfalls of starting new projects with Rust or migrating to Rust from othe...

                                            Mahout 0.3: オープンソースの機械学習プロジェクト
                                          • Perl で MapReduce - Mahout Frequent Pattern Mining Data - - hamadakoichi blog

                                            最近、Perl も書き始めてみたので、Hadoop 上で分散実行できる Perl での MapReduce 実装を紹介する。大規模データマイニング・機械学習のライブラリ Apache Mahout の Parallel Frequent Pattern Mining の入力データを生成する Perl MapReduce 実装の紹介。 Frequent Pattern Mining 入門 Frequent Pattern Mining (Association Analysis )は、隠されたルールパターンを抽出するアルゴリズム。有名な例としては、1992年のウォルマートのクリスマス商戦で「おむつを買った人は半ダースのビールを買う可能性が最も高い」という頻出ルールを抽出し、商品陳列に活かした売上向上した事例。 入門資料: 第5回R勉強会@東京 で話してきた - 「R言語によるアソシエーション

                                              Perl で MapReduce - Mahout Frequent Pattern Mining Data - - hamadakoichi blog
                                            • Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop

                                              Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop

                                                Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
                                              • Mahout in Action

                                                pro $24.99 per month access to all Manning books, MEAPs, liveVideos, liveProjects, and audiobooks! share your subscription with another person choose one free eBook per month to keep exclusive 50% discount on all purchases lite $19.99 per month access to all Manning books, including MEAPs! team 5, 10 or 20 seats+ for your team - learn more

                                                  Mahout in Action
                                                • Mahout使って分析しちゃいました。

                                                  EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

                                                    Mahout使って分析しちゃいました。
                                                  • AppEngineでMahoutを使ったレコメンド機能を作ってみた - Orfeon Blog

                                                    Apache Mahoutは様々な機械学習・データマイニング手法を、Hadoopを利用してスケーラブルに取り扱うことができるライブラリなのですが、ちょっとしたレコメンド機能の開発にも手軽に利用することができます。今回は自分用の備忘録も兼ねてAppEngine/Javaでの利用実例を紹介してみたいと思います。 やったこと 先日リリースした漫画の読書管理Webサービス「コミックライブラリー(コミ蔵)」 で漫画の関連シリーズのレコメンド機能を作成しました。Amazonとかでよくある商品の関連アイテムのレコメンドです。利用するユースケースやデータ量にもよりますが、意外と簡単にAppEngine上のサービスで推薦機能を使えるようになりました。 実行構成 レコメンド機能の実行の流れは下記の通り。 レコメンド機能を実装したServletをcronで1週間に1回、Backend Instance上で実行。

                                                    • Mahoutを使ったNaiveBayesによる機械学習 - Y's note

                                                      入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック 作者: Matthew A. Russell,奥野陽(監訳),佐藤敏紀(監訳),瀬戸口光宏(監訳),原川浩一(監訳),水野貴明(監訳),長尾高弘出版社/メーカー: オライリージャパン発売日: 2011/11/26メディア: 大型本購入: 18人 クリック: 779回この商品を含むブログ (42件) を見る BigDataでの機械学習 膨大なデータに対して機械学習を行いたい時にlocalの端末一台では処理の時間が掛かりすぎてしまいます。学習、モデル作成、予測のそれぞれの処理を高速で行うための一つのSolutionがHadoop上で機械学習をしてしまうことだと思います。Hadoop上で機械学習をするための便利なライブラリとしてJAVAベースのMahoutがあります。この記事ではMahoutによるNaiveBayes分類学習を

                                                        Mahoutを使ったNaiveBayesによる機械学習 - Y's note
                                                      • Mahout の開発環境を Maven+Eclipse で作る (1) - 木曜不足

                                                        Mahout in Action 買ったんだけど、開発環境の作り方についてはほとんど何も書いてない。いや、それも大事なことだと思うぞ。 というわけで、Mahout 用の開発環境をちょっとまじめに作ってみた。 とりあえず今回は Mahout in Action のサンプルコードを Eclipse 上で動かすところまで。 いろいろインストール 必要なものをインストール。今回入れたのはこんな感じ。それぞれの入れ方は略。まあ JAVA_HOME を設定して、パスを通すぐらい。 OS が Windows 2008 x64 なので、Java と Eclipse は x64 版を入れている。 Cygwin Java SDK 6u23 x64 Eclipse 3.6(helios) SR1 x64 Maven 3.0.2 (Hadoop 0.21.0 0.20.2) Cygwin は Mahout が D

                                                          Mahout の開発環境を Maven+Eclipse で作る (1) - 木曜不足
                                                        • 第3回 Mahoutの環境構築とFP-Growthによるマーケットバスケット分析 | gihyo.jp

                                                          HadoopとMahoutをインストールする Hadoopのバージョンに注意 前回はマーケットバスケット分析の理論編として、アソシエーション分析とアプリオリアルゴリズムについて解説しました。今回は実践編として、Mahoutが実装しているアプリオリアルゴリズムを改良したFP-Growthを用いて、実際にマーケットバスケット分析を行ってみましょう。 そのための準備として、まずMahoutとHadoopをインストールする必要がありますが、 その際1つ注意する点があります。現在のMahoutの最新バージョンである0.7は、利用するHadoopのバージョンが0.20系である必要があります。しかし、Apacheの公式サイトからはすでにHadoopのバージョン0.20をダウンロードすることはできません。 Hadoopのバージョン0.20をお持ちでない方は、Cloudera社のページからダウンロードするこ

                                                            第3回 Mahoutの環境構築とFP-Growthによるマーケットバスケット分析 | gihyo.jp
                                                          • Mahout RandomForest Driver 実装法 -大規模分散 機械学習・判別 - - hamadakoichi blog

                                                            Apache Mahout は、Hadoop上で動作する大規模分散データマイニング・機械学習のライブラリ。 Random Forest は大規模データで高精度の分類・判別を実現するアルゴリズム。 Random Forestを、"R言語での実行のように容易"に "大規模分散 学習・判別"できるように、 Mahout を用いた各種 Driver を実装しました。 以下に実行方法、実装を紹介します。 org.mahoutjp.df.ForestDriver Random Forest の分散学習から、分散判別、判別結果出力、および、精度評価まで行う Driver。 org.mahoutjp.df.ForestClassificationDriver 生成された Forest Modelを用いて、分散判別、判別結果出力、および、精度評価まで行う Driver。 両 Driver とも、1コマンドで

                                                              Mahout RandomForest Driver 実装法 -大規模分散 機械学習・判別 - - hamadakoichi blog
                                                            • 機械学習/MacでMahoutを使う - とうごろうぃき

                                                              2011-02-19 (土) 15:28:21 (4747d) | Topic path: Top / 機械学習 / MacでMahoutを使う はじめに † Apache Mahoutは,分散環境Hadoopの上で動くスケーラブルな機械学習ライブラリーです. ただし,「Hadoop上でMapReduceを使った機械学習をやりたい」という強い意思がないと,サンプルを動かして終わりになります. 「別にMapReduceでなくてもいい」という人は,別のツールを使ったほうがいいでしょう. この記事の内容は,Mac OS X 10.6.6, Hadoop 0.20.2, Maven 3.0.2, Mahout 0.40で確認しました. ↑ 必要なもの † Java SE 1.6 Mac OS X 10.6.6には標準でJava SE (JDK) 1.6が入っていると思います. ユーティリティーにあ

                                                              • Mahoutにパッチを送ってみた

                                                                実践・最強最速のアルゴリズム勉強会 第二回講義資料(ワークスアプリケーションズ & AtCoder)AtCoder Inc.31.1K views•107 slides

                                                                  Mahoutにパッチを送ってみた
                                                                • Mahout の開発環境を Maven+Eclipse で作る (3) Eclipse で Hadoop の開発環境を作る - 木曜不足

                                                                  Mahout の、と言いつつ今回も Hadoop の話ばかり。 Hadoop は各ノードにアプリケーションを配布する関係から、通常 jar を作らなければならない。そのため、Eclipse で書いたコードを実行するのもデバッグするのも非常にめんどくさい。 でもうまくやれば、スタンドアローンモード限定だが、Eclipse から jar も作らずそのまま Map-Reduce ジョブを起動できる。デバッグ実行もできるので、ブレイクポイント入れてステップ実行とかも可能だ。 今回はそういう環境の作り方の話。ずいぶん苦労したけど、出来るようになったら簡単。 Eclipse のセットアップなどは済んでいるものとする。Mahout の開発環境を Maven+Eclipse で作る (1) - Mi manca qualche giovedi`? 参照。 なお、Hadoop を展開すると contrib/

                                                                    Mahout の開発環境を Maven+Eclipse で作る (3) Eclipse で Hadoop の開発環境を作る - 木曜不足
                                                                  • Mahout Programming : K-Means Clustering - hamadakoichi blog

                                                                    Mahout でのデータマイニング。mahout.clustering.kmeans を使ったクラスター分析を実装してみた。Mahoutは、Hadoop上で動くデータマイニング・機械学習の各種アルゴリズムが実装されているライブラリ。 クラスター分析 クラスター分析の方法論自体の内容は以下のエントリにまとめてある。 R言語プログラミング: クラスター分析 - 階層的クラスタリング - hamadakoichi blog 第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」 - hamadakoichi blog 第3回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#3) を開催します - hamadakoichi blog R言語プログラミング: クラスター分析

                                                                      Mahout Programming : K-Means Clustering - hamadakoichi blog
                                                                    • Apache Mahout - Random Forests - #TokyoWebmining #8

                                                                      Koichi HamadaSenior Staff Research Engineer, Artificial Intelligence at DeNA

                                                                        Apache Mahout - Random Forests - #TokyoWebmining #8
                                                                      • 第11回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 11th) -Mahout・Graphical Model・学術 祭り-を開催しました - hamadakoichi blog

                                                                        2011/06/12 "第11回 データマイニング+WEB 勉強会@東京−Mahout・Graphical Model・学術 祭り−"を開催しました。 第11回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 11th)−Mahout・Graphical Model・学術 祭り−: Eventbrite Google グループ 会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。 参加者一覧: 以下、全講師資料、関連資料、ツイートまとめです。 AGENDA: ■Opening Talk: O1.「データマイニング+WEB勉強会@東京 について」(10分) 講師 : id:hamadakoichi

                                                                          第11回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 11th) -Mahout・Graphical Model・学術 祭り-を開催しました - hamadakoichi blog
                                                                        • Mahout Canopy Clustering - #TokyoWebmining 9

                                                                          Koichi HamadaSenior Staff Research Engineer, Artificial Intelligence at DeNA

                                                                            Mahout Canopy Clustering - #TokyoWebmining 9
                                                                          • Apache Mahout お手軽レコメンド

                                                                            SQL Server 2017 Machine Learning Services (CLR-H in TOKYO #13)Tomoyuki Oota

                                                                              Apache Mahout お手軽レコメンド
                                                                            • Mahoutのseqdirectoryとseq2sparseを使って文書クラスタリング | mwSoft

                                                                              概要 Mahoutのexamples/binの下には、cluster-reuters.shというロイターの記事をクラスタリングする処理を実演してくれるシェルがいる。 このシェルでは、seqdirectoryとseq2sparseという2つのコマンドを使って、テキスト文書をVectorに変換している。 これを参考にして、青空文庫から取ってきたいくつかの文書をクラスタリングして遊んでみる。 Mahoutのバージョンは0.7。 bin/mahout seqdirectoryは、テキストファイルの入ったディレクトリから、シーケンスファイルを生成する。 とりあえず下記のようなテキストファイルを適当なディレクトリ(仮に/tmp/tekitou/sample.txtとする)に入れて、実行してみる。 我輩はプログラマである。 仕事はしていない。 ファイルはHDFSに置く。 $ hadoop fs -put

                                                                              • Mahout Recommendation - #TokyoWebmining 14th

                                                                                Koichi HamadaSenior Staff Research Engineer, Artificial Intelligence at DeNA

                                                                                  Mahout Recommendation - #TokyoWebmining 14th
                                                                                • Mahout JP を立ち上げました #MahoutJP - hamadakoichi blog

                                                                                  Hadoop上で動作する 大規模データマイニング・機械学習ライブラリ Apache Mahout に関し、技術情報まとめ・発信よる活用の裾野を広げることを目的としMahout JPを立ち上げました。 私も含め TokyoWebminingでMahoutに関する各種講師をしていたメンバーや、Tokyo.R、PRML会のメンバー含め、各業界のデータマイニング・機械学習で活動してきたメンバーで集まり、Mahoutに関する情報まとめ・発信をしていきます。 Mahout JP -Effective Applications of Apache Mahout in Japan- #MahoutJP 現在、Mahout はドキュメントがまだ整備されていなく、唯一ある書籍 Mahout in Actionでも情報が限られているため、実際に活用しようとするとソースコードから読み込む必要がある状態です。今回、

                                                                                    Mahout JP を立ち上げました #MahoutJP - hamadakoichi blog