タグ

2014年12月21日のブックマーク (3件)

  • GroovyでApache Sparkアプリケーションを作る #gadvent - nobusueの日記

    このエントリは G*Advent Calendar(Groovy,Grails,Gradle,Spock...) Advent Calendar 2014 - Qiita の12/20担当分です。 Apache Sparkとは? Hadoopエコシステムにおける次世代の分散処理基盤として注目されています。インメモリ処理とDAGによるタスクスケジューリングを特徴とし、分散処理に必要な耐障害性を備えています。また、RDDという共通のプログラミングモデルの上で機械学習やストリーミング処理が統一的に扱えるため、複雑なビッグデータ処理を実装するのに有利です。 概要をつかむにはこのへんの資料がよいかと思います。 Spark MLlibではじめるスケーラブルな機械学習 from NTT DATA OSS Professional Services Groovyから使ってみようと思った動機 公式サイト A

    GroovyでApache Sparkアプリケーションを作る #gadvent - nobusueの日記
    nyasba
    nyasba 2014/12/21
  • ネスト構造のJSONデータにApache Drillで直接SQLクエリをかける - nagix

    この記事は Spark, SQL on Hadoop etc. Advent Calendar 2014 の18日目の記事です。 Drill のここがすごい 先日 Apache Drill も晴れて Apache Software Foundation のトップレベルプロジェクトになりまして、来年初頭のバージョン1.0リリースに向けて機能が追加され品質も徐々に高まってきています。さて、Drillとはどういうものかについては去年のHadoopアドベントカレンダーの記事でも触れました。 が、改めてDrillの特徴と他のSQL-on-Hadoopプロジェクトとどういうところが違うのかについて説明しましょう。 速攻使える (Agility) リレーショナルデータベースの世界でも、データウェアハウスの世界でも、そして近年のHadoopのような分散処理プラットフォームの世界でも、データ分析を行う上での

  • 週刊ソフトウェアテスト 2014-51 #swtest_jp - うさぎ組

    前書き ソフトウェアテストにまつわるニュースを週毎にお届けする記事です。内容はid:kyon_mmの独断と偏見です。オススメの記事があるときや、質問などなどはコメントや@kyon_mmにご連絡くださるとうれしいです。 ハッシュタグ #swtest_jp でソフトウェアテストに関する事をツイートしてくださるととてもうれしいです!(なにかの紹介でも、議論でも、質問でも! kyon_mmの意見 Uncle BobがTDDを行うときのサイクルの時間を状況毎にまとめてくれました。The Cycle of TDDわかりやすい例でとてもよいかと思います。まぁみなさんこれくらいを基にやりましょう。 先週はシステムテスト自動化カンファレンスが東京で開催されました。僕も講演とハンズオン講師をしました。ハンズオンではシステムテストがいかに難しいかということを感じつつも、第一歩や目標といったものを感じてもらえた

    週刊ソフトウェアテスト 2014-51 #swtest_jp - うさぎ組