[B! hadoop][データマイニング] wasaiのブックマーク

wasai id:wasai

hadoopとデータマイニングに関するwasaiのブックマーク (11)

Cloudera Impala #pyfes 2012.11.24
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...MapR Techno logies Japan
wasai 2012/11/25
slideshare

Hadoop

Cloudera

Impala

データマイニング

分散処理
リンク
ApacheがGoogleのリアルタイムビッグデータツールDremelのオープンソースクローンDrillを
When Alex Ewing was a kid growing up in Purcell, Oklahoma, he knew how close he was to home based on which billboards he could see out the car window.…
wasai 2012/08/18
TechCrunch

Google

Hadoop

ビッグデータ

Dremel

データマイニング

OSS

Apache
リンク
大規模データマイニング・機械学習 Mahout 活用に向けて読んでおきたい12のプレゼン資料 - hamadakoichi blog
2012年度が始まり1ヶ月が経ちました。2011年度は、大規模分散処理技術・データ基盤の普及が広く進んだ年だったと思います。2012年はそれら蓄積された大規模データを活用しデータマイニング・機械学習を用い、ビジネス・サービス洗練を大きく広げていく年ではないでしょうか。 Mahoutは大規模分散データマイニング・機械学習のライブラリです。ApacheプロジェクトのOpen Sourceで、Hadoop上で動作しデータマイニング・機械学習の大規模分散実行を行うことができます。 Apache Mahout 大規模分散データマイニング・機械学習を実行できる Mahout ですが、まだ「ドキュメント整備が発展途上で詳細を知るためにはソースコードから読み解く」必要がある場合が多く、また、活用には「対象とするデータマイニング・機械学習の基礎知識」が必要なため、まだまだ活用の敷居が高いのが現状ではない
wasai 2012/05/05
データマイニング

機械学習

Hadoop

mahout
リンク
ログ解析についてつらつらと考えていること - wyukawa's diary
ログ解析についてつらつらと考えていることを書いてみたいと思います。 Hadoopを用いたログ解析によってマーケティングを変革し売り上げを向上させようという話はよくあります。この手の話はたいていBtoCで例としてはメールでレコメンドして商品を買ってもらうとかですね。ログ解析がどういうフローかというと、ログを埋め込んでログを収集して蓄積して解析してそのレポートを見て何らかの施策を打つ、という感じになります。図にするとこんな感じ今話題沸騰中の「Fluentd」はログ収集を担当します。といいつつ僕自身はFluentd使ったことないです。記事を読んだくらいです。ちなみにどれぐらい話題沸騰中かというとこれぐらい定員オーバーしてます。すごすぎ。クレジットカード現金化詐欺【業界人が教える口コミ情報】ログ埋め込みはJavaならLog4j使って埋め込んだりするでしょう。 Apacheのアクセスロ
wasai 2012/01/24
ログ

Hadoop

データマイニング
リンク
第3回　レコメンドシステム－協調フィルタリングのHadoopへの実装［前編］ | gihyo.jp
今回はいよいよHadoopを用いたレコメンドシステムについて説明します。今回のポイントは以下の通りです。処理をMapReduceフレームワークへ変換することで、分散処理のメリットを享受アウトプットからkeyについて着目し、処理ロジックを考える簡単な処理でも数段階のMapReduce処理を踏む場合がある前回までのおさらい分散処理の基本的な考え方は、大規模データあるいは処理する問題を小さく、かつ、互いに独立した単位に分割して並列に処理することで、各処理単位の出力を結合することで最終的な結果を得るというものです。Hadoopは数ある分散処理のフレームワークの実装のひとつで、システムレベルの詳細の多くを意識せず、処理ロジックに集中して設計できる特徴があります。 Hadoopで処理するため、前回紹介したユーザの映画評価の履歴をHDFSのディレクトリにコピーすると、HDFSは履歴を各ノード
wasai 2011/12/27
読んでおく

Gihyo

Hadoop

MapReduce

データマイニング
リンク
第14回データマイニング+WEB 勉強会＠東京( #TokyoWebmining 14th)－大規模分散データマイニング祭り－を開催しました - hamadakoichi blog
2011/10/16 "第14回データマイニング+WEB 勉強会＠東京"を開催しました。第14回データマイニング+WEB 勉強会＠東京 ( #TokyoWebmining 14th)−大規模分散データマイニング祭り−: Eventbrite Google グループ会場提供し運営を手伝って下さったニフティ株式会社のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。参加者ID・バックグラウンド一覧：以下、全講師資料、関連資料、ツイートまとめです。 AGENDA： ■Opening Talk： O1.「データマイニング+WEB勉強会＠東京について」(10分) 講師： id:hamadakoichi [Twitter:@hamadakoichi] オープニングト
wasai 2011/10/18
あとで読ませてもらいます

勉強会

データマイニング

TokyoWebmining

資料

hadoop

slideshare
リンク
第10回データマイニング+WEB 勉強会＠東京 ( #TokyoWebmining 10th)を開催しました −2nd Week−大規模分散機械学習祭り− - hamadakoichi blog
2011/04/10 "第10回データマイニング+WEB 勉強会＠東京−2nd Week−大規模分散機械学習祭り−"を開催しました。第10回データマイニング+WEB 勉強会＠東京　( #TokyoWebmining 10th)−2nd Week−大規模分散機械学習祭り−: Eventbrite Google グループ会場提供し運営を手伝って下さったニフティ株式会社のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。以下、全講師資料、関連資料、ツイートまとめです。 AGENDA： ■Opening Talk： O1.「データマイニング+WEB勉強会＠東京について」(10分) 講師： id:hamadakoichi [Twitter:@hamadakoi
wasai 2011/04/11
あとで見ておく

勉強会

Web

データマイニング

Hadoop

Mashout

HBase

R

まとめ

資料
リンク
Facebookの新しいリアルタイム解析システムとは？ - nokunoの日記
Facebookの新しいリアルタイム解析のシステムでは、HBaseで1日200億件のイベントを処理しているそうです。以下の記事の翻訳です。High Scalability - High Scalability - Facebook’s New Realtime Analytics System: HBase to Process 20 Billion Events Per DayFacebookがまたやってくれた。彼らは巨大なリアルタイムデータのストリームを処理するもう1つのシステムを構築したのだ。以前にもFacebookはリアルタイムなメッセージシステムをHBaseで構築している(http://highscalability.com/blog/2010/11/16/facebooks-new-real-time-messaging-system-hbase-to-store-135.ht
wasai 2011/03/27
あとで読んでおく

facebook

HBase

hadoop

アクセス解析

データマイニング

あとで読む
リンク
『モバゲーの大規模データマイニング基盤におけるHadoop活用』－Hadoop Conference Japan 2011－ #hcj2011
『モバゲーの大規模データマイニング基盤におけるHadoop活用』－Hadoop Conference Japan 2011－ #hcj2011 2011/02/22 [登壇後エントリ] ：" 「モバゲーの大規模データマイニング基盤におけるHadoop活用」－Hadoop Conference Japan 2011 #hcj2011 で登壇してきました " http://d.hatena.ne.jp/hamadakoichi/20110222/p1Read less
wasai 2011/02/25
あとで見る

DeNA

Hadoop

conference

データマイニング

あとで読む
リンク
第９回データマイニング+WEB 勉強会＠東京に参加してきた - nokunoの日記
というわけで行ってきました。第９回データマイニング+WEB 勉強会＠東京　( TokyoWebmining 9)?1st Week? 大規模解析・機械学習・クオンツ祭り? : ATNDFirst Weekって。■大規模解析：1. Mahout Canopy Clustering (講師：@hamadakoichi)(発表30分＋議論60分)　Canopy Clusteringは通常の多くの手法と異なり、クラスタ数指定を必要とせず、指定距離離れたクラスタ算出を実現する。　Hadoop上で動作する大規模データマイニング・機械学習ライブラリ Mahoutでの実行法も含めお話しします2. 機械学習＝機械の代わりに人間が学習 (講師：@shuyo))(発表20分＋議論40分)　Gihyo.jp でも機械学習の連載し裾野を広げる活動をされている @shuyo さん。　今回、機械学習の歴史や専門外
wasai 2011/01/18
あとで読んでおこう

ATND

Web

データマイニング

勉強会

hadoop

あとで読む
リンク
第８回データマイニング+WEB 勉強会＠東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ祭り−を開催しました - hamadakoichi blog
2010/11/14 "第8回データマイニング+WEB 勉強会＠東京"を開催しました。第8回データマイニング+WEB 勉強会＠東京 (Tokyo.Webmining#8) −大規模解析・ウェブ・クオンツ祭り−: ATND Google グループ会場提供し運営を手伝って下さったニフティ株式会社のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場、USTREAMともに多くの方々の参加を嬉しく思っています。今後も「データマイニング+WEB 勉強会＠東京」を、講師、参加者、双方にとってよりよい会としていきたいと思いますので、今後ともよろしくお願い致します。次回は2011年１月第２週か、３週の週末に開催予定です。みなさんぜひご参加下さい。以下、講師資料一覧、ツイートまとめ、参加者の声、および、次回第９回「大規模解析・自然言語処理・
wasai 2010/11/22
量が半端でないのであとで読む

データマイニング

勉強会

web

hadoop

あとで読む
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx