大英図書館が新サービス、British Newspaper Archive を公開しました。読んで字のごとく、新聞データの巨大デジタルアーカイブです。どれくらい巨大かというと、ページ数で言えば4000万ページというボリューム。OCR されているため、検索もできます。1800年以降に発行された多くの新聞をデータ化したことで、ただ研究者がマイクロフィルムを探さずに古いニュースを読めるというだけでなく、出生欄や死亡欄から先祖を発見したり、広告などから当時の文化を知るといった使いかたも考えられるところ。もちろんこれほどのインフラが整えば、頻出語の変遷など、統計的な分析も期待されます。 データ化には brightsolid 社が協力しており、Zeutschel社の A0 スキャナ 5台を利用して、24bitカラー・400dpiのデジタルデータ化を実現したとのこと。検索は無料。閲覧には有料の会員登録が