タグ

clusterとlinuxに関するykogのブックマーク (4)

  • Hadoop Clusterの作り方 - LunaBiblos

    概要 Hadoop Clusterの構築方法を解説します。Hadoopについての説明やHadoopを利用する際に事前に知っておくべき情報等はHadoopの基情報を参照してください。 なおここではUbuntuにHadoopをインストールして行きます。インストール手順は大まかに次の作業を行います。 Linux側の設定、準備 Hadoopのインストール Hadoopの設定 Linux側の準備 Hadoop Cluster構築の為に必要なコンポーネントをインストールします。 sudo aptitude install rsync ssh JavaのInstall http://java.sun.com/javase/ja/6/download.html 上記画面から対応するJavaのダウンロードURLを取得します。DLした後、ファイル名が長いので変更します。(この名称変更作業は必須ではあり

  • Hadoop:So-net Developer Blog:So-netブログ

    Hadoopはlog4jを使って、大量のログを生成しています。連日ジョブを走らせている ような環境では、NameNodeのログ領域はGバイト単位で肥大化してディスクを圧迫します。 ログの出力ディレクトリをシステム領域と共有している場合などは、ディスク残容量 不足でシステムトラブルの原因にもなりえます。 見落としがちですが、ログの管理もやっておきましょう。 ローテーションについては、Hadoopがやってくれているので、不要なログを抑制して 不要になった古いログは削除するようにします。 ログの抑制についてですが、CDHを使う限りHDFSへのアクセスにパーミッションを設定して はいないので、HDFSへの監査ログは不要と思われます。 しかも、この監査ログがHDFSへのアクセスの度に記録されるので、肥大化の原因になって ます。 log4j.properties中に定義されている「SNamesyste

  • Hadoopを用いたクラスタコンピューティング環境の構築 - SourceForge.JP Magazine : オープンソースの話題満載

    ペタバイト規模のデータを格納させる分散コンピューティング用プラットフォームを探しているのであれば、そのフレームワークとして Hadoop の使用を検討すべきだろう。HadoopはJavaベースで作成されているため、LinuxWindows、Solaris、BSD、Mac OS Xにて使用できる。こうしたHadoopを実際に採用している組織に共通するのは、安価(特殊なハードウェアが不要)かつ効率的でスケーラビリティと信頼性を兼ね備えたプラットフォームによる、膨大な量のデータ処理を必要としているという点だ。 Hadoopでは、こうした膨大な量のデータを格納するために、Hadoop Distributed File System(HDFS)を採用している。実際、HDFSのマスタ/スレーブアーキテクチャは、Hadoopのクラスタ機能の中核を成している。ここでサポートされているのは、ファイルシステ

    Hadoopを用いたクラスタコンピューティング環境の構築 - SourceForge.JP Magazine : オープンソースの話題満載
  • 企業で使われるHadoop

    Copyright © 2004-2024 Impress Corporation. An Impress Group Company. All rights reserved.

  • 1