秘密主義で有名な米アップル(Apple)が、知られざる社内ビッグデータ環境の一端を明らかにした。2018年6月4~6日(米国時間)に米サンフランシスコで開催された「Spark + AI Summit 2018」で、オープンソースソフトウエア(OSS)の分散データ処理ソフト「Apache Spark」の利用事例を公表したのだ。 アップルが社内におけるOSSの利用事例を公開するのは珍しい。5日の基調講演には情報セキュリティ部門に所属するドミニク・ブレジンスキー(Dominique Brezinski)氏が登壇して、セキュリティ監視や不正検出にSparkを活用していることを紹介した。6日の技術セッションでも、社内に構築するストレージ容量1エクサバイトを超えるSparkクラスターの詳細や、Spark用のリソーススケジューラーを自社開発した事情などを説明している。 アップルはSparkを使ううえで、