タグ

2016年4月12日のブックマーク (3件)

  • rubyからグラフデータベースneo4jを利用する - Qiita

    neo4jとは neo4jとはNeo Technologyが開発したJavaベースのグラフデータベースです。(日語ページ) グラフデータベースは、一つ一つのデータを行で表現するリレーショナルデータベースと異なり、 ノード(頂点)、リレーションシップ(エッジ)、プロパティ(属性)という3つの基構成要素でデータを格納します。 グラフデータベースが有用なのはTwitterやFacebookのように、フォローや友人関係を扱う時です。 「友人のそのまた友人を探す」や「任意の二人を選択し、最短の関係(パス)を探す」などの問題を解こうとしたとき、 リレーショナルデータベースでは関係の探索に大量の結合演算が必要になりますが、 グラフ構造をそのまま格納しているグラフデータベースなら高速に処理することが可能です。 neo4jはオープンソースですが、ライセンスはAGPLv3なので、商用利用などの際はライセン

    rubyからグラフデータベースneo4jを利用する - Qiita
  • グラフDBのNeo4jを1日触ってみた - Wantedly Engineer Blog

    こんにちは!Wantedlyで12月中にインターンシップをしていた後藤です. 今回,業務の一環としてグラフDBであるNeo4jを1日触ってみたので,それに関してつらつら書いてみたいと思います. Neo4jって? Neo4jはグラフDB(データの構造が全てグラフ構造で表されるDB)の1つです. Javaで実装されており,オープンソースとして公開・開発が進められています. Neo4j公式 グラフDBの位置付け,及びその性質に関しては次の記事が分かりやすいでしょうか. SQLかNoSQLかという分類だと勿論NoSQLに分類されます.が,Key-Value型やドキュメント指向のものとはまた異なります. InfoQ グラフデータベース、NOSQLNeo4j RDBやKey-Value型のDBなど,他のタイプのDBとの比較については公式マニュアルに簡単にまとめられています. 2.2. Compari

    グラフDBのNeo4jを1日触ってみた - Wantedly Engineer Blog
  • 「パナマ文書」解析の技術的側面

    世界中で話題になっているパナマ文書。各国で政権を揺るがすような事態にもなっていますが、純粋にデータとしてみた場合、これは計算機やデータ解析に関わる人々にも面白いものだと思います。データの中身や背景などについてはさんざん報道されていますのでここでは触れません。一方、現場でどのような作業が行われているのかはあまり報道されていません。現実的な問題として、人力ではどうしようもない量のリークデータを手に入れた場合、調査報道機関はどんなことを行っているのでしょうか?私も以前から疑問に思っていたのですが、先日あるデータベース企業と、データ分析アプリケーションを作成する会社のブログにて、その実際の一端を窺うことができる投稿がありました: Panama Papers: How Linkurious enables ICIJ to investigate the massive Mossack Fonseca

    「パナマ文書」解析の技術的側面