日本IBMは8月1日、国立国会図書館が進めている蔵書のデジタル化作業に関連して、全文テキスト化システムのプロトタイプを開発、提供したことを発表した。 同プロトタイプは、IBM東京基礎研究所が開発した、一般のユーザーと視覚障がいをもつユーザー、アクセシビリティの専門家などがインターネット上で協働し、Webページのアクセシビリティを向上させるSocial Accessibilityのコンセプトが応用されており、多数の作業者がWebブラウザ経由で同時に協調して作業することを可能にする。ひらがなやカタカナ、漢字、ルビ、縦横書きの混在など、日本語特有の問題を解消し、明治以降の日本語書籍の全文テキスト化作業の効率化、全文テキストデータ検索および表示などが実現できるという。 具体的には、Webブラウザ経由で多数の文字校正者が同時に作業を行う「共同校正機能」を実装し、校正の作業結果をOCR(光学式文字認識
![国会図書館に全文テキスト化システムのプロトタイプを提供 日本IBM](https://cdn-ak-scissors.b.st-hatena.com/image/square/7c723672ceb65322d92fd5659d86b3cbd38fe7b7/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fenterprise%2Farticles%2F1108%2F01%2Fibm01.jpg)