[B! hadoop][tutorial] todogzmのブックマーク

IBM Developer

IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.

todogzm 2010/06/18

リンク

まず、 1 の入力ファイルを分割する方法は、InputFormatクラスの、getSplits関数を上書きすることで、カスタマイズできます。また、 3 のInputSplitから、KeyとValueを抽出する処理も、InputFormatクラスを通じてカスタマイズできます。 InputFormatのgetRecordReader関数を通じて、RecordReaderクラスを生成するのですが、これに任意のRecordReaderクラスを指定すればOKです。 2 のMap処理ですが、ユーザが指定したMapperクラスの処理を実行します。 Mapperクラスは、MapRunnerクラスを通じて、初期化処理、map関数を繰り返す過程、終了処理といった一連の流れを実行します。 MapRunnerクラスをカスタマイズすれば、こうした流れを制御することができます。 0.20.0からの新しいMapRed

todogzm 2010/01/27

リンク

Hadoopで、かんたん分散処理 (Yahoo! JAPAN Tech Blog)

ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、地域サービス事業部の吉田一星です。今回は、Hadoopについて、Yahoo! JAPANでの実際の使用例を交えながら書きたいと思います。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。複数のマシンへの分散処理は、プロセス間通信や、障害時への対応などを考えなければならず、プログラマにとって敷居が高いものですが、 Hadoopはそういった面倒くさい分散処理を一手に引き受けてくれます。 1台では処理にかなり時間がかかるような大量のデータも、複数マシンに分散させることで、驚くべきスピードで処理を行うことができます。例えば、今まで1台でやっていた、あるログ集計処理

todogzm 2010/01/27

リンク

Hadoopのインストールとサンプルプログラムの実行

前回はGoogleの基盤技術とそれに対応するオープンソースソフトウェアとして、Hadoop & hBaseを紹介しました（図1 参照）。今回はHadoopを1台にインストールし、サンプルプログラムを動かします。次にHDFSとMapReduceのアーキテクチャを解説します。最後にサンプルプログラムのソースコードを解説します。 2. Hadoopの概要 Hadoopは主にYahoo! Inc.のDoug Cutting氏によって開発が進められているオープンソースソフトウェアで、GoogleFileSystemとMapReduceというGoogleの基盤技術のオープンソース実装です。Hadoopという名前は開発者の子供が持っている黄色い象のぬいぐるみの名前に由来しています。HadoopはHDFS（Hadoop Distributed File System）、Hadoop MapReduce F

todogzm 2009/12/22

リンク

Hadoop Map/Reduce チュートリアル翻訳: 藤田昭人 IIJ Innovation Institute 2008 年 12 月 10 日 This translation in Japanese is the derivative work of “Hadoop Map/Reduce Tutorial” documentation, whose copyright owner is The Apache Softwa

Hadoop Map/Reduce チュートリアル翻訳: 藤田昭人 IIJ Innovation Institute 2008 年 12 月 10 日 This translation in Japanese is the derivative work of “Hadoop Map/Reduce Tutorial” documentation, whose copyright owner is The Apache Software Foundation. Copyright (c) 2008 IIJ Innovation Institute Inc. Licensed under the Apache License, Version 2.0 (the ”License”); you may not use this ﬁle except in compliance with th

todogzm 2009/12/22

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

hadoopとtutorialに関するtodogzmのブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (2)

hadoopとtutorialに関するtodogzmのブックマーク (5)

IBM Developer

Hadoopを使いこなす(1)

Hadoopで、かんたん分散処理 (Yahoo! JAPAN Tech Blog)

Hadoopのインストールとサンプルプログラムの実行

Hadoop Map/Reduce チュートリアル 翻訳: 藤田昭人 IIJ Innovation Institute 2008 年 12 月 10 日 This translation in Japanese is the derivative work of “Hadoop Map/Reduce Tutorial” documentation, whose copyright owner is The Apache Softwa

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Hadoop Map/Reduce チュートリアル翻訳: 藤田昭人 IIJ Innovation Institute 2008 年 12 月 10 日 This translation in Japanese is the derivative work of “Hadoop Map/Reduce Tutorial” documentation, whose copyright owner is The Apache Softwa