パナマ文書については、いろいろな方面で話題になっているが、我々の情報科学の分野的にもなかなか興味深い事件である。 ただ今回の興味のポイントは、ハッキングとかではない。ポイントはデータのサイズ。「文書」と言うが、実は1150万ファイル、2・6テラバイトという巨大データの塊がその正体だ。 経済犯罪で検察や調査報道の記者が行うのが押収文書の分析。文書を読み込んでその中に出てくる登記上の名前や住所が実質同じなのかとか、取引相手の血縁関係といった相関図を作り金の流れを追い、本当は誰の金なのかを解き明かす。 しかし、2・6テラバイトは小さめの図書館にも匹敵する文書量。その分析はもはや人間のおよぶところではない。当然コンピューターの出番となる。 この記事は有料記事です。 残り826文字(全文1146文字)
![坂村健の目:パナマ文書 調査報道の将来 - 毎日新聞](https://cdn-ak-scissors.b.st-hatena.com/image/square/a4467117db3ee96a0c5fc340a02dbdb433c2b8b3/height=288;version=1;width=512/https%3A%2F%2Fcdn.mainichi.jp%2Fvol1%2F2021%2F01%2F18%2F20210118hpr00m070017000q%2F11.jpg%3F1)