*印の営業所につきましては、 営業時間が一部変更の日、期間がございます。 詳しくは営業所一覧をご確認ください。
ブログの総集編です。下記にあるリンクを参照してください。 Hadoopを使ってみたい! 新しく何かを始めようと思った時、面倒だなぁと思うことは多いものです。書籍やブログをみて「これは役立ちそうだ」と思っても、ちょっと試すことにさえにも辿り着けず、頓挫しているものがTODOリストやPocket(旧Readitlater)に大量にあります。 #書いていて嫌な気持ちになってきた、、、 Hadoopはそんな面倒なものの一つかもしれません。書籍を読んで「よし、やってみるか」という強い決意を持ったすぐ後、 「試すにはマシンを買わないといけないのかなぁ」 「いや、EC2でいけそう。アカウントどうしようか」 「なんか仮想マシンでもできそうって書いてある」 という第一の壁があります。 運良く壁を乗り越えたあと、 「ソフトはどこからダウンロードすればいいだっけ?」 「コマンドラインでやるの?」 「設定面倒そう
(本ブログは若干古くなっているので、Impala情報ページをご覧下さい。比較的新しい情報をまとめています) 一人アドベントカレンダー25日目、最終日です。 最終日はCloudera Impala(以下Impala)について。Impalaは分散クエリエンジンです。最近EMRでも利用できるようになりました。 Hiveとは何が違うのか、なぜHiveを高速化しなかったのかというような意見もあるようですが、その答えはClouderaの創業者でもあるMike Olsonが今週公開したブログ(Impala v Hive)に詳しく書かれています。かなり興味深い内容ですが、今のところ英語のみです。きっと日本語の記事もいずれ読めるようになるはず。。。 さて、最終日はCloudera Impalaのアーキテクチャについて書いてみます。引用している資料はSlideshareでClouderaが公開しているものです
株式会社NTTデータは、オープンソースの大規模データ処理基盤ソフトウエアHadoopの普及を加速するために、米国Cloudera社(クラウデラ)と協業を行うことで合意しました。 Hadoopは、大量データの処理・分析により、新しい領域のビジネスや新しい価値の創出に活用できるソフトウエアとして、金融分野やテレコム分野での採用が進んでいます。日本国内で複数のHadoopシステムの構築・運用の実績を有しているNTTデータと、Hadoopのディストリビューション(配布用パッケージ)および米国内でのサポートサービスや教育サービスを提供するCloudera社が協業することによって、日本およびアジア太平洋地域でのHadoopシステムのさらなる普及を目指します。 具体的には、NTTデータは、Hadoopのディストリビューション「Cloudera's Distribution for Hadoop」を日本国
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く