Sho Shimauchi @shiumachi "Sparkは、ビッグデータ処理ソフトの定番「Hadoop」に続く、次なるビッグデータ処理の主役に目され始めている" ちょっと私の理解と違うかなあ itpro.nikkeibp.co.jp/atcl/column/15… 2015-06-23 00:23:56 Sho Shimauchi @shiumachi SparkはHadoopと比較するのではなく、 MapReduceと比較するものだと思っている。 バッチ処理(MapReduce)や、SQL (Impala/Presto/Drill)、全文検索(Solr/Elasticsearch)等に並ぶ新しい分散処理がSparkという認識 2015-06-23 00:24:54 Sho Shimauchi @shiumachi そもそもHadoopは何か。HDFS(分散ストレージ)+MapRed
日報とか、進捗をちょくちょくプライベートのtumblogにつけている。良いなと思う議論が研究室のSlackであったら、それをコピーして貼りつけている。このtumblogに蓄積されるデータは、僕のメインのtumblogよりも濃厚で、良質なデータである傾向が高いと思う。メインのtumblogは、データを大量に集めて、クラスタリングして、自分の位置づけをしていくような、そういうものだと思っているからそれはそれでいい。 さて、良質なデータは蓄積され続けるけど、見返す良い手段がない。しかし、ここで、重要な古典を引っ張り出してみる http://kenmat.tumblr.com/post/150649917kenmat.tumblr.com Tumblrについては発生当初から議論されていて、今もなお、それについて考え続けている人がいる。よく分からないけど、インターネットを超えた向こう側に居るっぽい。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く