torinkyのブックマーク / 2016年6月16日

torinky id:torinky

2016年6月16日のブックマーク (5件)

Publickey － Enterprise IT × Cloud Computing × Web Technology / Blog
torinky 2016/06/16
YARNの登場によりHadoopは複数の並列分散処理エンジンを併用できる環境へ。Hadoop Conference Japan 2014

unclassified
リンク
2015年のHadoopとビッグデータ活用 | gihyo.jp
あけましておめでとうございます。濱野賢一朗です。 1年は早いものですね。本当にあっという間に過ぎ去ってしまうものです。しかし、いざ1年を振り返ってみると、いろんなことが起きていたのだと実感したりもします。ここでは「ビッグデータ（Big Data）活用」が2015年にどう変化していきそうか、Hadoopの話題を中心に紹介したいと思います。 2014年を振り返るまずは、昨年を振り返ってみましょう。急浮上したバズワードという印象の「ビッグデータ活用」も、すこし落ち着いてきました。まだまだ浮ついた話を耳にしましたが、一方で、具体的な事例や技術の話も増えてきた1年でした。システム基盤の観点では「Hadoop」の変貌が始まりました。皆さんご存じのとおり、Hadoopは並列分散処理を実現するオープンソースソフトウェアです。技術的側面での変貌は2015年に本格化すると思いますが、その下準備が着実に行
torinky 2016/06/16
2015年のHadoopとビッグデータ活用

unclassified
リンク
コミッタが語る、HadoopやSpark、2016年はどうなる？ | gihyo.jp
あけまして、おめでとうございます。例年、Apache Hadoopを中心に並列分散処理ミドルウェアの動向や展望についてご紹介しています。今年は、NTTデータに所属する鯵坂明（Apache Hadoopコミッタ）岩崎正剛（Apache Hadoop開発者、HTraceコミッタ）関堅吾（Apache Yetusコミッタ）猿田浩輔（Apache Sparkコミッタ）の4名による対談からまとめた、HadoopとSparkを中心に2015年の振り返りと2016年の展望をご紹介します。対談の模様（1）鯵坂明氏（左）と岩崎正剛氏 2015年を振り返る 2015年の新春特別企画では「TezやSparkなどの新しい処理基盤の活用が進むことになる」と紹介しました。実際に振り返ってみると、Apache Sparkはかなり盛り上がりました。 Apache Sparkは、年初にバージョン
torinky 2016/06/16
コミッタが語る，HadoopやSpark，2016年はどうなる？

unclassified
リンク
コードネームの決め方 - にょきにょきブログ
プログラマの仕事のうち、名前付けという作業は大きな割合を占めるのではないでしょうか。頻繁に名前付けを行いますし、かつ、センスが求められる部分でもあります。今回は変数名やメソッド名ではなく、プロダクト名につけるコードネームについて。今までの経験上、コードネームの付け方についてある程度知見が貯まり、パターンが見えてきました。ここでその知見を記録したいと思います。コードネームの決め方に慣習があればそれに従え！例えば植物の名前とか、島の名前、山の名前、物語のキャラクターの名前、といったような慣習があれば割と楽に決められることでしょう。逆に、無ければ何か慣習を作っておくと便利です。例えば島の名前で決める、という慣習を決めたとすると、結構良い名前がざくざく出てきます。Lesbos, Malta, Aruba, Vaila, などなど。イニシャリズム方式は愛着が湧かないぞ！コードネームをイ
torinky 2016/06/16
コードネームの決め方

unclassified
リンク
分散処理に入門してみた（Hadoop + Spark） | Casley Deep Innovations株式会社技術ブログ
こんにちは。SI部の腰塚です。 RDBやデータウェアハウスの仕事に携わることが多かった筆者は、数年前からたびたび聞こえたビッグデータ分析や機械学習のための分散処理フレームワークに興味を覚えたものの、ついぞアクセスしないままここまで来てしまいました。今回ブログを書くにあたって、せっかくなのでイチから手さぐり入門し、いまさら他人に聞けない分散処理の初歩からhadoop・sparkを触ってみるまでをまとめたいと思います。 1.分散処理の基礎知識 1-1.分散処理の処理方式：MapReduce まず分散処理とは、ひとつの計算処理をネットワークで接続した複数のコンピュータで同時並列で処理することです。ビッグデータ活用の市場が日々大きくなるに従って、数百テラ～ペタのデータ処理も珍しいものではなくなっており、日常的にこの規模のデータを扱うシステムでは、現実的な時間的・費用的コストで処理する工夫が必要
torinky 2016/06/16
キャスレーコンサルティング　技術ブログ

unclassified
リンク
- 2016年6月17日
- 2016年6月16日
- 2016年6月15日