組織や人間の様々な活動を通じて、文書や音声、画像、映像といった非構造化データが大量に生み出されています。例えば、従業員が作成したオフィス文書や、顧客とのコミュニケーションで使われるメールやソーシャルメディア、コールセンタで記録する通話録音、病院で撮影するレントゲン写真などが非構造化データに相当します。 これら非構造化データは生成された直後は頻繁に利用されますが、時間とともに参照されなくなり、いずれファイルサーバーなどに放置されたままになりがちです。特に訴訟リスク回避や防犯、監査などが目的の場合、記録したデータはアーカイブされるのみで、ほとんど参照されることはありません。 とはいうものの、非構造化データにはCRM(顧客関係管理)やERP(統合基幹業務システム)などの構造化された業務データにはない貴重な情報が含まれています。近年、企業内に蓄積される非構造化データ量が増えるにつれ、これらデータの