タグ

2022年11月11日のブックマーク (1件)

  • グーグルと毎日新聞、戦前の紙面をデータ化 23年秋に完成予定 | 毎日新聞

    IT大手グーグルは9日、報道機関向けの取り組みを紹介するオンラインでの記者会見を開いた。毎日新聞社などと共同してデジタル化に取り組む。グーグル法人ニュースパートナーシップ部の友田雄介・北アジア統括は「質の高い情報をつくることはジャーナリズムの根幹。その報道機関がビジネスとして持続可能になるためのサポートができたら」と、目的を強調した。 グーグルが掲げる社会貢献活動の一環。2022年に創刊150年を迎えた毎日新聞については、1872(明治5)年の創刊号(2月21日付)から終戦の1945(昭和20)年までの紙面をデータ化するプロジェクトを始める。具体的には、東京社で発行した朝・夕刊計約23万ページの紙面の画像を解析し、キーワード検索ができるようにする。2023年秋の完成を見込んでいる。将来的には図書館や大学向け記事データベース「…

    グーグルと毎日新聞、戦前の紙面をデータ化 23年秋に完成予定 | 毎日新聞
    bulldra
    bulldra 2022/11/11
    ファクトとして過去の新聞記事OCRがあると、特定の言葉や概念などが出てきた時期についての既存の通説や研究が簡単にひっくり返る可能性がでてくるから重要なんだよな