印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 「ビッグデータ」の処理テクノロジとしては、構造化データ向きのRDBMS、非構造化データ向きのHadoopという使い分けが定石的考え方になりつつある。しかし、企業内には大量の文書という非構造化データもある。このデータを処理する(より正確に言えばユーザーが活用可能にする)テクノロジとしてサーチエンジンを忘れてはならない。そもそも、MapReduce等のGoogleの「ビッグデータ」処理基盤もサーチエンジンがその起源だ。 「ビッグデータ」時代のサーチの重要性 大規模ウェブサービスプロバイダーや通信事業者、そして無線タグを活用する小売業や運送業などを除く一般的企業内の非構造化データは、今のところMicrosoft OfficeファイルやEメール
![「ビッグデータ」に対するサーチエンジンからのアプローチ](https://cdn-ak-scissors.b.st-hatena.com/image/square/cbce8eb3e1202776e40e775ec1f264f0e287de1c/height=288;version=1;width=512/https%3A%2F%2Fjapan.zdnet.com%2Fmedia%2Fz%2F2023%2Fzd_ogp.png)