[B! java][programming][computing] shu_ohm1のブックマーク

shu_ohm1 id:shu_ohm1

javaとprogrammingとcomputingに関するshu_ohm1のブックマーク (2)

Apache Sparkとは？：Hadoopに続く分散処理のフレームワーク｜データ分析用語を解説 - データビジュアライズで経営を視える化する/graffe グラーフ
SparkはHadoopの後発として期待されるビッグデータ処理基盤今日は「Apache Spark」という言葉について説明します。先日「Hadoop(ハドゥープ)」についての掲載をさせていただきましたが、その中でHadoopとは、巨大データの取り扱いを目的とした分散処理のフレームワークである分散処理によってビッグデータを高速に処理することができる Hadoopの利用者は自作したデータ処理のプログラムや他者が開発したツールプログラムをHadoop内に組み込んでビッグデータ処理を行うと説明させていただきました。またその他関連記事の中で、 Hadoop上で稼動するデータベースマネージメントシステム(DBMS)としてHive・Impalaがあり、同じくHadoop上で稼動するスクリプト環境としてPigがあるこれらHadoop連携ソフトウェアの存在がビックデータ処理環境をより便利なものに
shu_ohm1 2017/03/30
SparkはHadoopと比較して、主としてインメモリ処理による高速化を図り、データ格納方式としてHDFS以外にも Cassandra, OpenStack Swift, Amazon S3 等にも対応し、Java, Python, R から高度に制御できるといった特徴がある

computing

programming

java

python

r_lang
リンク
Apache Spark で分散処理入門 - Qiita
Welcome to ____ __ / __/__ ___ _____/ /__ _\ \/ _ \/ _ `/ __/ '_/ /___/ .__/\_,_/_/ /_/\_\ version 2.0.0 /_/ 2016年7月末にApache Spark 2.0.0がリリースされ、始めてみたので色々メモメモなのでご容赦ください🙇 また、この記事中にサンプルで載せているコードはjavaがメインですがscala、pythonの方がすっきりかけている気がじます。これからも随時編集していきます Apache Spark とは上の画像はhttps://spark.apache.orgから、場合によってはHadoopのMapReduce100倍速いらしいです、強い、Spark Sparkは巨大なデータに対して高速に分散処理を行うオープンソースのフレームワーク。 (Java Magazin
shu_ohm1 2017/03/30
computing

programming

java
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx