日本経済新聞社が100年分の新聞記事をテキストデータにする取り組みを進めている。AI(人工知能)を組み込んだOCR(光学的文字認識)で紙の新聞を効率的に読み取る。読み取り対象には約140年前の1876年に創刊された「中外物価新報」などを含む。中外物価新報は日本経済新聞の前身となった新聞だ。2019年5月以降、テキストデータにする作業を始める予定だ。 日本経済新聞社は1970年代から約40年、新聞に掲載した記事のテキストデータを管理してきた。しかしそれ以前の100年分の新聞についてはテキストデータは無く、原本をスキャンしたイメージデータだけを保存していた。 「過去の新聞の内容をテキストデータにした上で記事ごとにタグ情報を加えれば、検索しやすくなる。かつての日本の経済状況を把握したり分析したりするのも容易になる」。同社の山田剛日経イノベーション・ラボ上席研究員は今回の取り組みの狙いをこう説明す
Photo by rawpixel on Unsplashすでに出版した著書があったとします。その上で、著者が出版社に対していくらかの費用を支払うと、著書をオープンアクセスにできる場合があります。そこで、だいたいいくら出せばオープンアクセスになるのかを調べてみました。 まず海外の出版社。多くの著名な学術出版社がそういった著者出資によるオープンアクセスのプログラムを提供しています。各出版社ごとに、オープンアクセスにかかる一般的な費用、ライセンス、現在オープンアクセスになっている出版点数(DOAB への収録点数)を調べてみました。 Cambridge University Press ・・・12万語までで14,500ドル(約160万円)。1千語追加するごとに84ドル。CC BY-NC。13点。Oxford University Press ・・・費用は要相談。 CC BY-NC-ND が多そう
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く