2023年12月05日 実験サービス次世代デジタルライブラリーにおいて、 資料画像に含まれる表から表形式の構造化テキストデータを作成する新機能を追加しました。 また、新機能実現のためのプログラムのソースコード及び開発時に作成したデータセットを公開しました。 1. 新機能について 資料画像の表示画面でデジタル化資料の表領域を選択することによって、当該領域内のOCRテキストデータをHTML又はTSV形式に構造化して取得することができるようになりました。 利用手順は以下のとおりです。 1) ビューワ右上のパネルから二段目一番右の「表の構造化」アイコンをクリックする 2) ポップアップの指示に従って「範囲選択」をクリックする 3) 構造化したい領域をドラッグアンドドロップで選択する(オレンジ色の箇所が選択領域) (画像の出典:台湾総督府農業試験所 編『台湾総督府農業試験所彙報』第197号 甘藷の生