タグ

OCRと検索に関するmorobitokozouのブックマーク (1)

  • 自衛隊イラク日報の全文検索サイトが登場 個人が3時間程度で制作

    防衛省が、当初存在しないとしていた自衛隊イラク派遣時の日報を4月16日に公開。その膨大な資料を全文検索できるサイト「イラク日報 全文検索【イラク日報村】」が17日夜に有志によりWeb上で公開され、話題を呼んでいます。 日誌の全文データは朝日新聞デジタルなどがWeb上で公開していますが、そのままでは文字検索ができないPDFファイルとなっていたため、1万ページ以上ともいわれる内容を精査するのは大変でした。 イラク日報 全文検索【イラク日報村】 制作したのはマーケティングリサーチ会社ポップインサイトに務める森川公康(@alea12)さん。業務の間を縫って、自衛隊の日誌検索サイトを作ってしまいました。 検索をすると、文字列がヒットしたPDFファイルへのリンクと、その文字列が出現するPDF内のページ番号が表示される親切な仕組み。サイトのトップページには「人気のキーワード」ランキングも表示されます。

    自衛隊イラク日報の全文検索サイトが登場 個人が3時間程度で制作
  • 1