2016年6月16日のブックマーク (5件)

  • Publickey - Enterprise IT × Cloud Computing × Web Technology / Blog

    torinky
    torinky 2016/06/16
    YARNの登場によりHadoopは複数の並列分散処理エンジンを併用できる環境へ。Hadoop Conference Japan 2014
  • 2015年のHadoopとビッグデータ活用 | gihyo.jp

    あけましておめでとうございます。濱野 賢一朗です。 1年は早いものですね。当にあっという間に過ぎ去ってしまうものです。しかし、いざ1年を振り返ってみると、いろんなことが起きていたのだと実感したりもします。ここでは「ビッグデータ(Big Data)活用」が2015年にどう変化していきそうか、Hadoopの話題を中心に紹介したいと思います。 2014年を振り返る まずは、昨年を振り返ってみましょう。急浮上したバズワードという印象の「ビッグデータ活用」も、すこし落ち着いてきました。まだまだ浮ついた話を耳にしましたが、一方で、具体的な事例や技術の話も増えてきた1年でした。 システム基盤の観点では「Hadoop」の変貌が始まりました。皆さんご存じのとおり、Hadoopは並列分散処理を実現するオープンソースソフトウェアです。技術的側面での変貌は2015年に格化すると思いますが、その下準備が着実に行

    2015年のHadoopとビッグデータ活用 | gihyo.jp
    torinky
    torinky 2016/06/16
    2015年のHadoopとビッグデータ活用
  • コミッタが語る、HadoopやSpark、2016年はどうなる? | gihyo.jp

    あけまして、おめでとうございます。 例年、Apache Hadoopを中心に並列分散処理ミドルウェアの動向や展望についてご紹介しています。 今年は、NTTデータに所属する 鯵坂 明(Apache Hadoopコミッタ) 岩崎 正剛(Apache Hadoop開発者、HTraceコミッタ) 関 堅吾(Apache Yetusコミッタ) 猿田 浩輔(Apache Sparkコミッタ) の4名による対談からまとめた、HadoopとSparkを中心に2015年の振り返りと2016年の展望をご紹介します。 対談の模様(1)鯵坂 明氏(左)と岩崎 正剛氏 2015年を振り返る 2015年の新春特別企画では「TezやSparkなどの新しい処理基盤の活用が進むことになる」と紹介しました。実際に振り返ってみると、Apache Sparkはかなり盛り上がりました。 Apache Sparkは、年初にバージョン

    コミッタが語る、HadoopやSpark、2016年はどうなる? | gihyo.jp
    torinky
    torinky 2016/06/16
    コミッタが語る,HadoopやSpark,2016年はどうなる?
  • コードネームの決め方 - にょきにょきブログ

    プログラマの仕事のうち、名前付けという作業は大きな割合を占めるのではないでしょうか。 頻繁に名前付けを行いますし、かつ、センスが求められる部分でもあります。 今回は変数名やメソッド名ではなく、プロダクト名につけるコードネームについて。今までの経験上、コードネームの付け方についてある程度知見が貯まり、パターンが見えてきました。ここでその知見を記録したいと思います。 コードネームの決め方に慣習があればそれに従え! 例えば植物の名前とか、島の名前、山の名前、物語のキャラクターの名前、といったような慣習があれば割と楽に決められることでしょう。逆に、無ければ何か慣習を作っておくと便利です。 例えば島の名前で決める、という慣習を決めたとすると、結構良い名前がざくざく出てきます。Lesbos, Malta, Aruba, Vaila, などなど。 イニシャリズム方式は愛着が湧かないぞ! コードネームをイ

    コードネームの決め方 - にょきにょきブログ
    torinky
    torinky 2016/06/16
    コードネームの決め方
  • 分散処理に入門してみた(Hadoop + Spark) | Casley Deep Innovations株式会社 技術ブログ

    こんにちは。SI部の腰塚です。 RDBやデータウェアハウスの仕事に携わることが多かった筆者は、数年前からたびたび聞こえたビッグデータ分析機械学習のための分散処理フレームワークに興味を覚えたものの、ついぞアクセスしないままここまで来てしまいました。 今回ブログを書くにあたって、せっかくなのでイチから手さぐり入門し、いまさら他人に聞けない分散処理の初歩からhadoop・sparkを触ってみるまでをまとめたいと思います。 1.分散処理の基礎知識 1-1.分散処理の処理方式:MapReduce まず分散処理とは、ひとつの計算処理をネットワークで接続した複数のコンピュータで同時並列で処理することです。 ビッグデータ活用の市場が日々大きくなるに従って、数百テラ~ペタのデータ処理も珍しいものではなくなっており、日常的にこの規模のデータを扱うシステムでは、現実的な時間的・費用的コストで処理する工夫が必要

    分散処理に入門してみた(Hadoop + Spark) | Casley Deep Innovations株式会社 技術ブログ
    torinky
    torinky 2016/06/16
    キャスレーコンサルティング 技術ブログ