3. 今日は皆既月食 • 11年振りの好条件、次のチャンスは2030 年1月31日らしい – 部分食始まり: 21時54分 – 皆既食始まり: 23時5分 – 皆既食最大: 23時31分 – 皆既食終わり: 23時58分 4. 流れ • 実装寄りの勉強会ということなの で・・・ • Mahoutがどのようにアルゴリズムを MapReduceで実装しているかをひたすら解 説 • 教師あり学習のみ • 送ったパッチについて紹介
Gunma.web #3でやったLTの一本目、真面目な方(´・ω・)っ スライド:「一番いいおすすめを頼む」 〜5分でわかるレコメンドエンジンの基礎〜 「一番いいおすすめを頼む」 〜5分でわかるレコメンドエンジンの基礎〜 (Gunma.web #3 2010/12/11)View more presentations from parrotstudio. 関連 WEB+DB PRESS Vol.57 naoya氏が書いた「アルゴリズム実践講座」の記事を参考に作った 参考と言うよりはほとんどそのまま・・・Σ(・ω・ノ)ノ 以前の記事 MapReduce風の手順でレコメンドエンジンを作る - ぱろっと・すたじお レコメンドエンジンの実装側の話 Rubyで無理矢理MapReduce風に書く的な 話が一般化されてない気がするので、いつか書き直したい・・・ Gunma.web #3のまとめ Gunm
Hadoopとは何かを解説し、実際にHadoopを使って、大規模データを対象にしたテキストマイニングを行います。テキストマイニングを行うサンプルプログラムの作成を通じて、Hadoopの使い方や、どのように活用できるのかを解説します いまさら聞けないHadoopとテキストマイニング入門 テキストマイニングで始める実践Hadoop活用(1) それぞれの概要や構成、MapReduceの仕組み、Hadoopの活用場面などを解説し、Hadoopの実行環境を構築します
2. とは? • Googleの基盤ソフトウェアのクローン – Google File System, MapReduce • Yahoo Research の Doug Cutting氏が開発 – 元々はLuceneのサブプロジェクト – Apache Project • Javaで記述! 3. Google関連 参考論文 & スライド • The Google File System – Sanjay Ghemawat, Howard Gobioff, and Shu-Tak Leong, SOSP 2003 • MapReduce: Simplified Data Processing on Large Clusters – Jeffrey Dean and Sanjay Ghemawat, SOSP 2004 • Parallel Architectures and Compila
ビッグデータ時代の救世主「Hadoop」とは 「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。 本連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。 重い処理を複数のマシンに分散させる 複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。 例えば、Hadoopを使うと、1
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く