タグ

Hadoopに関するpnepneのブックマーク (2)

  • Apache Hadoop - Wikipedia

    Apache Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークであり、Javaで書かれている。Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。HadoopはGoogleMapReduceおよびGoogle File System(GFS)論文に触発されたものである。 HadoopはApacheのトップレベルプロジェクトの1つであり、世界規模の開発貢献者コミュニティによって開発され、使用されている。[2] Hadoopは、以下の4つのモジュールによって構成されている。 Hadoop Common: 他のモジュールから共通して利用されるライブラリ群。 Hadoop Distributed File System (HDFS): Hadoop独自の分散ファイルシステム。 Hadoop YARN: Hado

  • Apache Lucene - Wikipedia

    Apache Lucene(アパッチ ルシーン)は、Doug Cuttingによって開発された、Java製のFLOSSの検索ライブラリである。Luceneは、強力な文書インデキシング及び検索機能、スペルチェック、ハイライト、テキスト解析機能を提供する。Apacheのトップレベルプロジェクトの1つである。 概要[編集] Luceneは、Apache Solr、Elasticsearch等の検索プラットフォームで利用される検索ライブラリである。以前はLucene.NET、Mahout、Tika、Nutchといったサブプロジェクトが存在したが、現在はすべて独立したApacheのトップレベルプロジェクトとなっている。2010年3月から、Apache SolrがLuceneのサブプロジェクトとして開発コミュニティがマージされた。 Luceneで日語のテキスト解析を利用するためには、Kuromoji

  • 1