Google Refineとは Metaweb社のFreebase Gridworksをベースに開発されたデータセットのクリーニング、解析、変換を行なうことができるオープンソースソフトウェアです。 インストールの方法 Google Refineは、インストールして自分のコンピュータ上で実行するデスクトップアプリケーションです。しかしながら、多くの他のデスクトップアプリケーションとは異なり、それが自分のコンピュータに小規模なWebサーバーとして実行され、Webブラウザ上でRefineに使用することができます。 ここからGoogle Refineをダウンロード MacOSX, Windows, LinuxのそれぞれのOSの指示に従ってインストール http://127.0.0.1:3333/にアクセス 開発版 開発版についてはこちらを参照 Google Refineはデータをクリーンナッ
Google Refine 2.0 http://code.google.com/p/google-refine/ Googleのデータクレンジングツール。ローカルwebサーバーで動作するアプリである。なぜローカルで動作するwebサーバにしているかというと、それには理由があるのだ。ほんと、ビックリ。 公開しているデータはタイトルやデータ形式がマチマチで、それを自分のところで統計解析するには、データレンジングをかなりやらなければいけなかった。そのためには、いままでgrepだとかfindだとかのコマンドやPythonスクリプトで半狂乱になって汚れ落としをしていたけれど、このGoogle Refineを使うとそういう問題がアホみたいに簡単に解決する。 例えば、カテゴリカルデータがセルに割り当てられているとする。記入者によってそれが略語だったりフルの名称だったりマチマチである。これを全て一つの文字
Gephi が再び Google Summer of Code (GSoC 2011) に認定されました! Google Summer of Code は、世界各地の学生がオープンソースプロジェクトに貢献することができるたいへん優れたプログラムです。詳細はこちら » 応用例 探索的データ解析: リアルタイムでのネットワーク操作による直感的分析。 リンク解析: 特にスケールフリーネットワークにおけるオブジェクト間関係の根本構造の明確化。 ソーシャルネットワーク分析: さまざまなコミュニティ組織やスモールワールドネットワークをマップ化できるソーシャルデータコネクタを簡単に作成可能。 生物学的ネットワーク解析: 生物学的データのパターンを表現。 ポスター制作: 高解像度の印刷可能グラフで学術研究成果をプロモート。 詳細はこちら » 各種のメトリクスを用意 中心性 (Centrality): 社会
RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です[GoogleEarthとR][ShapeFileライブラリ][空間的なデータの分析][Rでジオコーディング]関連リンク [RでGIS][maptools で地図表示][Rmapを使った地図表示]参考リンク 論文引用・書籍等に引用する場合の著作権についての連絡>>okinawa 目的 † GoogleEarth [http://earth.google.com/]はGoogleが無料で公開している3D-GIS用のソフトです。 現在、Windows版・Mac版・Linux版が公開されています。 Rを用いて、インタラクティブな操作によって3D-GISを作成するのは、今のところほぼ不可能です。 しかし、GUI部分をGoogleEarthにまかせて、バックエンド処理をRで行うと色々な場面
IT業界に新しい流行語がやってきた。「ビッグデータ」である。巨大なデータを、高度なデータマイニング手法によって深く分析し、その結果を活用する。そうすることで、専門家でさえ気づかない事象の変化への対応や、人を介さない意思決定が実現可能になる。ネット企業でなければ難しかったビッグデータの活用は、最近になって一般企業にも可能になってきた。そのためビッグデータの注目度が、一気に上がっている。 ビッグデータの活用は、米グーグルや米フェイスブックといったネット企業にとっては、企業競争力の源泉である。例えばグーグルは2010年6月の学会「ACM Symposium on Cloud Computing(SOCC)2010」で、同社が自社開発した分散バッチ処理基盤「MapReduce」を使って、月間94万6460テラバイト(2010年5月時点)というデータを処理していることを明らかにした。グーグルは毎月、
前回のコラムで、「Hulu(フールー)」などのネット映像配信の価値は、「配信」の部分でなく、検索・過去履歴・オススメ・ソーシャルなどといった「ネット独特のインテリジェンス」にある、ということを書いた。 このようにウェブの世界は、クラウドの中に存在するあらゆるデータを燃料として「インテリジェンス」を作り出す巨大な「発電所」の顔を持つ。そして、それを支える技術が、最近話題の「ビッグデータ」だ。 ビッグデータとは、膨大な量のデータを処理・分析し、その結果を業務に活用する仕組みのこと。金融など、定型的なトランザクションデータが膨大に発生する業界では、従来から自社内でそのデータを処理・分析して、株価の予測やオプション取引の価格づけなど、さまざまな目的に活用していた。 ところが、「ウェブ2.0」「クラウド」「ソーシャル」といった一連のネットの進化の中、ユーザーが生成するデータの増加、コンテンツのデジタ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く