[B! hatena][歴史] slay-tのブックマーク

slay-t id:slay-t

hatenaと歴史に関するslay-tのブックマーク (3)

国立国会図書館、来春までに247万点・2億2300万枚超の資料を全文テキストデータ化へ | Ledge.ai
LINE株式会社は、国立国会図書館（東京都千代田区）のOCRテキストデータ化プロジェクトに、同社の「CLOVA OCR」が採用されたと発表した。昭和前期以前の資料を中心にした247万点、2億2300万枚を超えるデジタル化資料が2022年3月までにテキストデータ化される。国立国会図書館では「ビジョン2021-2025 国立国会図書館のデジタルシフト」の一環として、デジタルで全ての国内出版物が読める未来をめざし、デジタル化資料をテキストデータ化する取り組みを進めている。今回テキストデータ化するデジタル化資料の多くは昭和前期以前の資料で、紙面のレイアウトが複雑だという。そのため、処理に多くの時間かかるうえに、学習機能のない既存のOCRでは読み取り精度が低かった。 CLOVA OCRは文書解析と認識に関する国際会議ICDARで評価された実績を持ち、ルビ・割注・割書きといった特殊な文書や、文字領
slay-t 2021/07/19
資料

データ

AI

hatena

books

歴史

仕事

news
リンク
【やじうまPC Watch】動作する「Apple I」がeBayで出品中。すでに1億5,700万円超え
slay-t 2021/02/02
apple

PC

hatena

歴史

はてな

auction
リンク
あなただけの「はてなブックマークタイムカプセル」
15年分のブックマークで再発見おかげさまで、はてなブックマークはサービス開始から15年を迎えました。その歴史を掘り起こし、特に注目を集めたページをまとめて、タイムカプセルに見立てました。サービス開始当初の2005年までさかのぼり、"インターネットの歴史"を感じていただくことができます。「今見ても古びないブログ」や「昔見つけたあのサイト」を再発見してみてください。はてなブックマーク全体の歴史あなただけのブックマーク他の人は知らなくても、あなただからこそ思い出せる。あなたが過去にブックマークした中から、そんなエントリーをピックアップしました。「あなただけの関心」は、日々誰かの新発見になります。これからもブックマークを通して、他のユーザーにとっても価値のある情報をつなげていきませんか。あなたの歴史
slay-t 2020/08/19
はてな

歴史

サービス

hatena

まとめ

history

ネット

はてなブックマーク
リンク
1