タグ

ブックマーク / www.omotenashi-mind.com (2)

  • Apache Spark入門 - omotenashi-mind

    はじめに Apache Sparkは多目的かつ高速なクラウドコンピューティングシステムです。Javaをはじめ、ScalaPythonから利用可能なAPIが提供されています。 また、Apache SparkにストアされたデータはSQLから参照できるようにもなっています。さらに、「MLlib」と呼ばれる機械学習機能、「GraphX」と呼ばれるグラフデータ機能や「Spark Streaming」と呼ばれるリアルタイム処理の仕組みも提供します。 何故高速なのか Apache Sparkはインメモリでの動作を前提に設計されています。 インメモリの場合、データの喪失の危険性がつきまといますが、その問題をカバーしているのがRDDs(Resilient Distributed Datasets)と呼ばれるアルゴリズムです。 RDDsはインメモリデータに対するフォールトトレラントな仕組みを提供して

  • Java:意外と教わる機会の少ないメモリ管理のお話 - omotenashi-mind

    変数の使い方、Web開発に必須となるSessionの概念など、当たり前のように書籍に記載されていますが、なかなか「メモリ管理」について基礎から教わる機会は少ないのではないでしょうか。 ここでは、Javaというプログラム言語を通してメモリ管理の考え方についてまとめて行きたいと思います。 お読み頂く前に ここでは主記憶装置のことを「メモリ」と表現します。あらかじめご了承ください。 はじめに オブジェクト指向設計、クラスとインスタンス、フレームワーク等など言語仕様やシステムを支えるアーキテクチャも進化を重ね、最近のシステムは実に複雑な処理を簡単に実現できるようなりました。半面、ソフトウェア開発に重要な変数の適切な取扱い方法やメモリの適切な管理方法などの基礎的な知識を身につける機会が減っているのではないでしょうか。ここでは改めてメモリ管理についてご説明することで、メモリの使われ方と適切な利用

  • 1