Copyright © 2004-2024 Impress Corporation. An Impress Group Company. All rights reserved.
Copyright © 2004-2024 Impress Corporation. An Impress Group Company. All rights reserved.
ビッグデータ時代の救世主「Hadoop」とは 「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。 本連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。 重い処理を複数のマシンに分散させる 複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。 例えば、Hadoopを使うと、1
ストレージには寿命があり、保存された情報は永遠に正常性を保証されるわけではありません。その為に別のストレージにデータをバックアップしたり、ストレージそのものを多重化してデータを保護することが重要です。今回紹介するは、ストレージデバイスを多重化し、データを複数のストレージに保存する仕組みで、DRBD(Distributed Replicated Block Device)と呼ばれているものです。同様の仕組みにソフトウェア/ハードウェアRAIDがあります。 DRBD(Distributed Replicated Block Device)とは、TCP/IPネットワークを通じて複数のサーバのストレージ(パーティション)をリアルタイムにミラーリング(複製)するソフトウェアです。RAID1のようなミラーディスクを構築することができます。ソフトウェア/ハードウェアRAIDは同じサーバ内のストレージを使
単体のWebサーバーでは処理しきれないユーザー要求を,複数のサーバーに振り分ける負荷分散装置――。大規模なWebサイトの構築に不可欠である。しかしネットワーク全体を見てうまく導入しなければ,思わぬトラブルに陥ることがある。本連載では,負荷分散装置を使いこなすノウハウを解説する。 サーバー負荷分散装置を使いこなす(1) 第1回 サーバー負荷分散装置を使いこなす(1) 第2回 サーバー負荷分散装置を使いこなす(1) 第3回 サーバー負荷分散装置を使いこなす(2) 第1回 サーバー負荷分散装置を使いこなす(2) 第2回 サーバー負荷分散装置を使いこなす(2) 第3回 サーバー負荷分散装置を使いこなす(2) 第4回 サーバー負荷分散装置を使いこなす(3) 第1回 サーバー負荷分散装置を使いこなす(3) 第2回 サーバー負荷分散装置を使いこなす(3) 第3回 サーバー負荷分散装置を使いこなす(4)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く