NDL Ngram Viewerの公開:全文テキストデータ可視化サービス 電子情報部電子情報企画課次世代システム開発研究室・青池亨(あおいけとおる) 国立国会図書館(NDL)は,次世代の図書館システムの開発に役立てるための調査研究を行っており,最近では特に,デジタル化資料の新たな利活用を想定した実験サービスを構築・提供している。 2021年度,NDLはデジタル化資料の光学文字認識(OCR)テキスト化事業に取り組み,国立国会図書館デジタルコレクション(デジコレ)に収録されているほぼ全てのデジタル化資料247万点(2億2,300万画像)のOCRテキストデータを作成した。このOCRテキストデータを活用したサービスとして,2022年5月31日にNDLラボのウェブサイトから実験サービス“NDL Ngram Viewer”を公開した。2022年8月現在,著作権保護期間の満了した図書資料約28万点のテキ
![E2533 – NDL Ngram Viewerの公開:全文テキストデータ可視化サービス](https://cdn-ak-scissors.b.st-hatena.com/image/square/7cab7903e416b2fdf7371adec7e411f5c8034d8a/height=288;version=1;width=512/https%3A%2F%2Fcurrent.ndl.go.jp%2Fwp-content%2Fuploads%2F2022%2F09%2FOGP.png)