Cloud Miningはタグクラウドや全文検索を使った構造化データに向いた検索エンジンです。 Webサイトで常に必要になるのが検索エンジンです。最近は全文検索エンジンが人気ですが、より大量の構造化データを検索するのに最適な検索エンジンとしてCloud Miningを紹介します。 デモです。IMDBを解析した検索エンジンです。 画面上部にタグ(検索キーワード)が出ています。 さらにタグを追加します。 最終的に1件にまで絞り込まれました。 こちらも別な検索エンジンです。 Cloud Miningは全文検索としてSphinxを使い、データからタグクラウドを生成したり、絞り込んだ件数の表示、年数や共演者などのデータをピックアップもできます。複雑な構造データから望んだレコードを取り出すのに使えそうです。 Cloud MiningはPython製のオープンソース・ソフトウェア(GNU Affero