もうこの手の話題は出尽くした感がありますが、最近Hadoopについて考えることが多いので、エントリにしてみます。なお、ここではベーシックなMapReduce+HDFSのことをHadoopと呼ぶことにします。 HadoopとはHadoopとは言わずと知れたGoogleのMapReduce/GFSのオープンソースのクローンです。MapReduceではプログラマはMapとReduceという2つの関数を書くだけで、並列分散処理をすることができます。これは(1) データを実際に持つマシンにプログラムを配布する (2) MapとReduceをつなぐShuffleフェーズでキーをグループ化してソートする、(3) 障害時のフェールオーバーやレプリケーション、といった処理をフレームワーク側が受け持つことによって、プログラマ側の負担を減らすものです。GFSに対応するHDFSにはファイルをクラスタに分散して保存
田原:孫さんが最近、しきりにおっしゃってる「光の道」というのがあります。ただ一般の人には(どういう問題なのか)よく分からない。 もう一つ、90年代はビル・ゲイツの時代だったといわれています。これはいわばコンピュータ、パソコンを動かすソフトが中心でウィンドウズの時代でした。 で、今はスティーブ・ジョブスの時代だといわれる。まさに孫さんがやってらっしゃるiPhone、iPadもそうですが、これからクラウドの時代だという。 日本でいちばんクラウドの最先端にいらっしゃるのは孫さんでしょう。今日はそのへんからまずお話をお聞きしたいと思います。 孫:クラウドの時代と最近はいわわれはじめていますね。一言でいうなら、インターネットの雲の上のようなイメージです。 これまでは会社でいえば社内にサーバーがあって、それにパソコンが繋がっていた。自宅でいえば自宅にあるパソコンで、その中のソフトやデータを使ってそのま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く