>>前回 ビッグデータに関する連載の3回目である。今回はビッグデータシステムを構築する際の2番目の手順に当たる「メタデータ変換」を取り上げる。ビッグデータの分析はこのプロセスの成果によって大きく左右される。つまり、ビッグデータを扱う処理全体の中でも重要なプロセスである。 前回、ソーシャルネットワーク(SNS)から収集される大量データが、自社のビジネスにとって意味のある情報かどうかを判断するには、コメントに含まれるキーワードを適切に抽出する技術が必要になると述べた。今回は、そのような技術として注目されている「セマンティック技術」について、テキストマイニング技術を例に紹介したい。 セマンティック技術とは、「情報の意味を、コンピュータにとって理解できる形で可視化し、コンピュータに処理を行わせる技術」である。例えば、「昔からリンゴが好きで、近所のスーパーで見かけるとつい買ってしまいます。」というコ