タグ

ブックマーク / tech-sketch.jp (3)

  • rChartsを使ってR言語のデータ分析結果を可視化する - Tech-Sketch

    最近、ビッグデータ、データサイエンティストという言葉を耳にする機会が増えてきました。そして、統計解析向けプログラミング言語である R にも注目が集まっています。R を使って、データ解析したいというニーズも増えてきています。今回、そのR で簡単なデータ解析した結果を、オープンソースパッケージのrCharts を使って可視化してみたいと思います。 統計解析向けプログラミング言語 R とは <img alt="Rlogo.png" src="http://tech-sketch.jp/Rlogo.png" width=181" height="137" class="mt-image-right" style="float: right; margin: 0 0 20px 20px;" /> R はオープンソースの統計解析向けのプログラミング言語であり、その開発実行環境でもあります。R が、他の

    Gln
    Gln 2014/01/04
  • Neo4jでグラフ問題を効果的に取り扱おう - Tech-Sketch

    世の中の課題を解決するに際しては、その対象をグラフとして表現することが広く行われます。このグラフ問題を効率的に解決するソリューションとして、グラフ構造に特化したアーキテクチャのデータベース Neo4j を紹介します。 グラフ問題 具体例 グラフ問題とはどのようなものでしょうか? ご存知でない方でも、グラフ問題を活用したシステムを日常的に使用しています。例えば、鉄道の経路検索システムです。鉄道の路線をグラフ化するには、駅をグラフのノードとして、駅のつながりをエッジとして表現します。 このグラフ問題は、Single Source Shortest Path(SSSP)問題を解決することになります。SSSP問題とは、図1のように駅と駅間の行き来できる経路およびその所要時間が与えられた場合に、ある駅を始点とし、他の駅へ行くための最短時間の経路を求めるものです。 図1 SSSP問題 ソリューショ

  • Hadoop Pig の使いどころ - Tech-Sketch

    「PigとHive何が違うの?」 「Difference between Pig and Hive? Why have both?(PigとHive何が違うの?)」 という質問を、先日、StackOverFlowで見かけました。恐らくHadoopを触ると一度は疑問に思う事ではではないでしょうか。 PigとHiveは、共にSQLライクな記法でMapReduceを書けるDSLですが、利用者数においてはHiveに軍配が上がっているようにみえます。 一方で、「Pigをもっと早く試せば良かった」というお話を伺うこともあり、有用(かもしれない)ツールであれば、正しく理解しておいた方がよさそうです。 というわけで、ここではPigの活用を探ります。 Pigの性能 Pigが今一つ利用されていないのは、SQLとの親和性に加え、性能面で、「JavaMapReduce>Hive>Pig」という傾向があるからで

  • 1