防衛省がこのほど公表し、朝日新聞デジタルで公開された、自衛隊のイラク派遣の際の活動報告(日報)の「日誌」の内容が、「読みものとして面白い」などと話題になっている。ただ日報はPDF形式で、日ごとにファイルが分かれており、日誌部分はごく一部。PDFをいちいち開き、日報部分を探すのはとても大変だ。 そこで、日誌の部分だけを抜き出し、画像とテキストで読めるブログ形式のWebサイト「自衛隊イラク日報 バグダッド日誌/バスラ日誌 一覧」を、個人開発者の@akiyanさんが公開した。ツイートボタンも備えており、面白い日誌を見つけたらTwitterに投稿することもできる。 @akiyanさんは、日報のPDF(計約8000ページ)をダウンロードし、JPEGに変換した後、画像からテキストを抽出するOCR機能を備えたGoogleのAPI「Google Cloud Vision API」を使って文字を抽出。その上
![「自衛隊イラク日報」読めるサイト、個人が公開 370日分をブログ形式で](https://cdn-ak-scissors.b.st-hatena.com/image/square/67d93b89cf2dad5ff4c2e7c012899de4b5fcc3ea/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fnews%2Farticles%2F1804%2F18%2Fcover_news117.jpg)