タグ

2013年6月12日のブックマーク (10件)

  • Hadoop ~Yahoo! JAPANの活用について~

    1. オープンソースカンファレンス 2010 Tokyo/Fall Hadoop ~ Yahoo! JAPAN の活用について~ 2010/9/10 ヤフー株式会社 R&D 統括部 角田直行、吉田一星 2. 自己紹介 角田 直行 ( かくだ なおゆき ) R&D 統括部 プラットフォーム開発部検索開発部 開発 3 2005 年 ヤフー株式会社入社 ヤフー地図 ヤフー路線 ヤフー検索 … 2010 年現在、検索プラットフォームを開発中 Copyright © 2010 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 3. 自己紹介 吉田一星 (よしだ いっせい) R&D 統括部プラットフォーム開発部検索開発部開発3 R&D 統括フロントエンド開発部アプリケーション開発部開発4(兼) R&D 統括部プラットフォー

    Hadoop ~Yahoo! JAPANの活用について~
  • Hadoop MapReduceプログラムを解剖する

    オープンソース・ソフトウェア「Hadoop」のMapReduceジョブは、標準ではJavaで記述します(その他には、Pig、Hive、JAQLといったものがあります)。しかし、意外と初心者には分かりにくいと筆者は感じます。記事では、MapReduceジョブのサンプルコードを使って、できる限り正しくコードの意味を理解し、MapReduceへの入り口を示したいと思います。 HadoopでMapReduceを記述するときに使うAPIが、0.19から0.20に変わるところで新しくなっています。実は、現時点でHadoopプロジェクト体からでさえも、新APIを使ったサンプルが提示されていません。記事では、新しいAPIで筆者が書き直したサンプルを使って解説しますので、このサンプルは0.19以前のHadoopでは動かないことに注意してください。この記事は、0.20.2を使って検証し、解説しています。

  • MRUnitでHadoop MapReduceの試験を - Taste of Tech Topics

    こんにちは。 落合です。 MRUnit を使った、 Hadoop MapReduce のテスト方法をご紹介します。 MRUnitとは MRUnitは、Hadoop MapReduce のテストのためのライブラリです。 これを使うと、Hadoop MapReduce の JUnitテストを行うことができます。 Context を自分で作る必要もないため、 Mapper や Reducer の in と out の確認が簡単にできます。 開発環境を作る ブログ執筆時点で最新の、Cloudera のディストリビューション CDH3u1 を使いました。 以下のサイトでTarball(hadoop-0.20.2-cdh3u1.tar.gz)をダウンロードし解凍します。 https://ccp.cloudera.com/display/SUPPORT/Downloads 解凍したら、libの下と、h

    MRUnitでHadoop MapReduceの試験を - Taste of Tech Topics
  • Hadoopのテスト環境はどうやるのがいいのか?

    御徒町@MultiVersionConcurrentClimber(MVCC) @okachimachiorz1 Hadoopで真に大事なのは、テスト環境だったりする。基的に分散環境が前提になるので、どのレベルまでが単体テストなのか?どの程度までローカルでテストできなくてはいけないのか?というのは常に問題になるわけで。その意味ではCI含めた開発環境の重要性は以前よりも高いな、と今日思った。 2011-06-21 00:50:47 御徒町@MultiVersionConcurrentClimber(MVCC) @okachimachiorz1 HadoopのOS化ってのは一つの流れだとは思うけど、その場合、その上位のDSLが開発環境になるわけで。では、そのDSLにどこまで、どのようなテスト実行環境があるの?ってのは、やっぱり重要で。そもそも「プラットフォーム」って何って考えるところまで行く

    Hadoopのテスト環境はどうやるのがいいのか?
  • Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜

    This document discusses using sliding windows to aggregate streaming data in MapReduce. It proposes buffering input tuples in mappers until a window is full, then emitting the aggregate. Combiners and reducers combine partial aggregates across windows. Window ranges are initialized and updated during merging to remove outdated data and handle late arrivals. This approach allows streaming aggregati

    Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
  • GoogleのMapReduceアルゴリズムをJavaで理解する

    GoogleMapReduceアルゴリズムをJavaで理解する:いま再注目の分散処理技術(前編)(1/2 ページ) 最近注目を浴びている分散処理技術MapReduce」の利点をサンプルからアルゴリズムレベルで理解し、昔からあるJava関連の分散処理技術を見直す特集企画(編集部) いま注目の大規模分散処理アルゴリズム 最近、大規模分散処理が注目を浴びています。特に、「MapReduce」というアルゴリズムについて目にすることが多くなりました。Googleの膨大なサーバ処理で使われているということで、ここ数年の分散処理技術の中では特に注目を浴びているようです(参考「見えるグーグル、見えないグーグル」)。MapReduceアルゴリズムを使う利点とは、いったい何なのでしょうか。なぜ、いま注目を浴びているのでしょうか。 その詳細は「MapReduce : Simplified Data Proc

    GoogleのMapReduceアルゴリズムをJavaで理解する
  • HTML5のMicrodataとは何か?

    HTML5では、HTML文書の中にメタデータを埋め込むための「Microdata」という仕様が含まれています。 最初に簡単なMicrodataの具体例を紹介します。HTML文書の中で明示的に人名であることを示したい内容があるとき、Microdataでは次のように書くことができます。 <div itemscope> <p>僕の名前は<span itemprop="name">山田太郎</span>です。</p> </div> この文書をWebブラウザで表示しても、 僕の名前は山田太郎です。 と表示されるだけで、特に何か変わったことが起きるわけではありません。しかし、このHTML文書を検索エンジンが読み込むと「山田太郎という文字列はnameである」と理解してインデックスしてくれる、といったことができるようになります(というのはあくまで例です)。 Microdataとは、文書の内容に対して機械に

    HTML5のMicrodataとは何か?
  • Microdata を使ってみよう。サンプルソースで学ぶ Microdata

    HTML5 Advent Calendar 2012、7日目の記事として、Microdata (マイクロデータ) に触れてみます。サンプルソースを中心に、実際のページでどのように使えるのかを示しました。これから Microdata を使ってみたいという人に少しでも参考になればと思います。 HTML5 Advent Calendar 2012、7日目の記事です。なんか軽い気持ちで書いてみますとか言ってしまったんですが、緊張しますね… さて、タイトルの通りなのですが、HTML Microdata (マイクロデータ) について簡単に触れてみようかなと思います。この辺の話題に関して、Microdata とは何かとか、詳しい解説はすでに色々な方が書かれていますのでそちらを見ていただく (文末にまとめてあります) として、この記事では、そういう解説は置いといて、Blog や、企業の Web サイトなど

    Microdata を使ってみよう。サンプルソースで学ぶ Microdata
  • ブログのHTMLをmicrodata(schema.org)を使って構造化する | HALAWATA.NET

    今回はブログの記事部分のHTMLをschema.orgのスキーマ(語彙)を使って構造化する方法を紹介します。 schema.orgとはGoogleMicrosoftYahoo!の3社が共同で開発している構造化データマークアップのためのスキーマのことで、セマンティックウェブを実現するためのものです。(schema.org以外にも様々なスキーマがあります)セマンティックウェブを実現することによって、検索エンジンなどのコンピュータがHTMLの構造を正しく理解することができるようになり、効率よく情報を収集し、ユーザーに提供できるようになります。 例えばパンくずリストを構造化のスキーマを使ってマークアップすることで、検索結果にパンくずリストを表示させることができるようになります。このブログでもHTML5 microdataを使ってWordPressでパンくずリストをGoogleに表示する方法を書

  • Search Console(サーチコンソール)を使うための設定方法 - WordPress超初心者講座

    WordPress(ワードプレス)で作ったサイトをGoogle アナリティクスに登録したら、あわせて利用したいのがSearch Console(サーチコンソール)です。どちらも、ウェブサイトの分析や改善には欠かせない無料ツールです。 Search Console(サーチコンソール)とは Search Console(サーチコンソール)は、Googleがウェブサイト所有者向けに提供する無料ツールです。Search Consoleでは、所有するサイトがGoogle 検索においてどのような評価を受けているのかを知ることができます。次項で、もう少しくわしく紹介しましょう。 Search Consoleを使ってできること ワードプレスで作ったサイトが、検索結果でどれくらいの順位で表示されるかは気になるところです。Search Consoleに登録すれば、以下の情報を簡単に知ることができます。 どんな

    Search Console(サーチコンソール)を使うための設定方法 - WordPress超初心者講座