Discover digital resources on Japanese Culture from all over the world.
リニューアルに際して、ブックマークレットの箇所も更新しました。(2022/12/21) 使えなくなってたのでまた更新しました。(2023/01/05) これは何の記事 国会図書館次世代デジタルライブラリーで古典籍が検索できるようになって、いよいよすごいことになっている。 / 古典籍資料の全文検索が可能になります! \ 11月1日(火)に、実験システム #次世代デジタルライブラリー に古典籍資料6万点のOCR全文テキストデータを追加します。これまでの明治以降の図書に加え、江戸期以前のくずし字等資料の全文検索も可能となります。https://t.co/9KT1CdaSYa pic.twitter.com/aOz7OmyWew— 国立国会図書館 NDL (@NDLJP) 2022年10月26日 まじでいいんですか? 次世代デジタルライブラリー上でテキストのダウンロードもできる(右下の「この資料の
2019年11月に開催されたイベント「GitHub Universe 2019」の中で、オープンソースコードを少なくとも1000年残すため、北極圏に作られたアーカイブ「GitHub Arctic Code Vault」にコードを保存する「GitHub Archive Program」が提唱されました。このプログラムによるデータ保存が完了したことを、GitHubが報告しています。 GitHub Archive Program: the journey of the world's open source code to the Arctic - The GitHub Blog https://github.blog/2020-07-16-github-archive-program-the-journey-of-the-worlds-open-source-code-to-the-arcti
この記事の言いたいこと マスコミのツイートを検索していつどのようなツイートをしたかを、簡単に集計できるツールを作った。 マスコミツイート横断比較 このツールを作ったのは、マスコミは権力者でありながら、その権力行為(世論へ影響を与える行為)について調査をすることが難しいからだ。 私は次のように考えた。 権力者は、透明化を進め情報を公開すべきだ マスコミは権力者だ マスコミは、透明化を進め情報を公開すべきだ マスコミも権力者として、その権力に見合う情報公開をしたほうが良いのではないかと思っている。 マスコミは政府や議員と同じく権力者である マスコミはよく、政府や議員に対して、「権力者は透明性を高め、情報公開をすべきだ」と言う。それはその通りだ。政府は情報公開を進めるべきだ。何故なら、政府や議員は権力者だからだ。その権力の源泉は法である。 同様にマスコミも権力者だ。権力とは、辞書によると「ある人
© 2016 - 2022 Association for Promotion of Infrastructure Geospatial Information Distribution. All Rights Reserved.
「(古い資料の)本文検索ができるようになれば、新たな本の価値を届けられる」。国立国会図書館次世代システム開発研究室の徳原直子室長は力を込める。 国立国会図書館(NDL)は2022年4月25日、新たに開発した「NDLOCR」をオープンソースとして公開した。NDLOCRは、書籍や雑誌などの画像データから本文のテキストデータを作成できるOCR(光学的文字認識)処理プログラム。明治~昭和期の独特なレイアウトにも対応しているのが特徴だ。古い資料でも本文検索ができるようになる。 NDLが蔵書のデジタル化に乗り出したのは2000年代に遡る。資料をスキャンし、主に「JPEG 2000」のフォーマットで保存、提供してきた。NDLが手掛けるオンラインサービス「国立国会図書館デジタルコレクション」から利用可能だ。 デジタル化を進める最大の目的は資料の保存にある。時がたつほど紙は劣化していくからだ。 ただし、ND
","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"
《この記事は約 6 分で読めます(1分で600字計算)》 デジタルアーカイブ推進コンソーシアム(DAPCON)は7月18日、2019年デジタルアーカイブ産業賞授賞式典を開催した。1990年代半ばに世界で初めて「デジタルアーカイブ」という言葉を提唱した月尾嘉男氏(東京大学名誉教授)に特別功労賞が授与され、「デジタルアーカイブの危機」と題した記念講演会が行われた。本稿では、その講演の模様を私見を交えつつレポートする。 “情報洪水”の時代 月尾氏はまず、アーカイブの成立条件として「収集」「分類」「検索」の3つを挙げた上で、爆発的に情報量が増え続けている“情報洪水”とも言うべき近年の状況について解説した。 テクノロジーアナリストのブレット・スワンソンは2007年1月に、Exaflood という造語を生みだしている(The Wall Street Journal “The Coming Exaflo
イギリスの大英博物館が、江戸時代の浮世絵師・葛飾北斎(かつしかほくさい)の行方知れずとなっていた作品が発見され、大英博物館がそれらを入手したと発表しました。 今回、大英博物館が収蔵品に加えたのが、「万物絵本大全図(ばんぶつえほんたいぜんず) 」という、103作品からなる挿絵本。1829年に北斎によって描かれた作品です。 この作品は1948年にオークションに掛けられ、コレクターの手に渡ってから行方がわからない状態でしたが、2019年にパリで見つかり、大英博物館が収蔵品に加えました。 「万物絵本大全図」はすでに大英博物館のオンラインコレクションで公開されており、どなたでも全て無料で閲覧することができます。浮世絵ファン、北斎ファンにはぜひ見てもらいたい作品群!
「日本で出版されるすべての本が収められる場所」、国立国会図書館が収蔵する約4560万点の浮世絵や図書、雑誌などから、選りすぐりの画像を集めたオンラインコレクション、NDLイメージバンク。 掲載されている画像は、すべて著作権保護期間を満了しており、無料で閲覧できるだけでなく、出典を記載すれば自由に転載することも可能です。 「国立国会図書館デジタルコレクション」にある数百万点以上の資料から、検索だけではみつけにくい、知られざる資料を幅広く取り上げ、分かりやすく親しみやすく紹介しています。 著作権フリー画像素材をダウンロードできるNDLイメージバンク NDLイメージバンクは、資料にわかりやすい解説を付けてテーマごとに紹介する、国立国会図書館の「電子展示会」のひとつ。 掲載されている画像は、国立国会図書館が所蔵する資料をデジタル化し、著作権保護期間が満了した、いわゆる著作権フリーの素材となっていま
『独学大全──絶対に「学ぶこと」をあきらめたくない人のための55の技法』著者の読書猿さんは昨年「独学」「執筆」に加えて「復刊」をライフワークとしていくことをTwitterで宣言した。この連載「読書猿が推す『良書復刊』プロジェクト」では、読書猿さんが推す復刊本や、復刊に関係する話を紹介していく。 2022年5月19日より、国会図書館による「個人向けデジタル化資料送信サービス」がスタートする。ごく簡単に説明すると「国会図書館デジタルコレクション所蔵の絶版本や雑誌が、自宅で読み放題になる無料サービス」だ。読書猿さんは、このニュースは全国の独学者にとっても福音であると話す。今回は、元司書でレファレンス担当だった書物蔵さんを対談相手に迎え、同サービスの使いこなし方、楽しみ方を語ってもらった。(取材・執筆/藤田美菜子) 第1回 元司書が語る!国立国会図書館の絶版本「読み放題解禁」がスゴい 膨大な資料を
本連載は2022年9月に書籍化されました。 羽仁五郎 編『學問・思想の自由のために』(北隆館、1950年) 今、地球上で最も読みづらい本の一つは、20世紀後半の日本の絶版本である。そのことを実感する機会がつい先日訪れた。 近年は古い貴重な書物ほどオンラインで読めるという矛盾した状況になっている。私は18世紀フランスの科学史が専門だが、18世紀に出版されたフランス語の本はそういう状況である。特にGoogle Booksが激しい勢いで書物をデジタル化してしまったこともあり、当時の新聞や雑誌を除けば、大半の刊本はネットで読めるという感覚がある。 しかし20世紀の書物となると、著作権の問題があるので原則としてオンライン公開されない。無論、言語ごとの差もある。英語、フランス語は最近の本でも最初の数ページくらいはGoogle Booksかオンライン書店のサイトで読める。だが、日本語の本はあまりそうなっ
LINE株式会社は、国立国会図書館(東京都千代田区)のOCRテキストデータ化プロジェクトに、同社の「CLOVA OCR」が採用されたと発表した。昭和前期以前の資料を中心にした247万点、2億2300万枚を超えるデジタル化資料が2022年3月までにテキストデータ化される。 国立国会図書館では「ビジョン2021-2025 国立国会図書館のデジタルシフト」の一環として、デジタルで全ての国内出版物が読める未来をめざし、デジタル化資料をテキストデータ化する取り組みを進めている。 今回テキストデータ化するデジタル化資料の多くは昭和前期以前の資料で、紙面のレイアウトが複雑だという。そのため、処理に多くの時間かかるうえに、学習機能のない既存のOCRでは読み取り精度が低かった。 CLOVA OCRは文書解析と認識に関する国際会議ICDARで評価された実績を持ち、ルビ・割注・割書きといった特殊な文書や、文字領
造船資料保存委員会 資料番号:月刊雑誌「船舶」 124041/月刊雑誌「船の科学」 124047 「船舶」および「船の科学」の全巻公開に当たって 廃刊二雑誌「船舶」および「船の科学」の全巻公開に当たり次の様に立場を表明するものであります。 1.既に廃刊されて久しい「船舶」と「船の科学」の出版社、著者の方々の、戦後から長年に渡った造船工学一般への著書を通しての貢献に対し、敬意と賞賛を表明するものであります。 2.この雑誌を広く、かつ末永く閲覧可能とすることにより、日本の海運界、造船界の活動及び技術を多くの方々にお知らせし、歴史に留め置くためにした作業であります。 3.この行為は非営利であり、公開の目的が研究・教育・啓発などであり、公開による効果が対象事物本来の目的に近いことなどを考慮した結果で、かつ船舶、海洋分野の学問研究、調査研究への貢献を目的とした学会活動の重要な一環を成すものと考えてい
1. はじめに2020年3月20日に発売されてから世界中で人気を博している任天堂Switch用ゲームソフト『あつまれ どうぶつの森(以下、あつ森と略)』、かくいう私もハマっております。今回の記事では、『あつ森』を大学院講義の教材として用いたことについてご紹介したいと思います。教材開発等の参考になれば幸いです。 2. 学術的に注目すべきポイント|標準的データ形式イギリスのBBCニュースは、COVID-19の世界的流行に伴う外出自粛期間において、『あつ森』における魚釣りや虫捕り、家の模様替えやどうぶつたちとの日常的なふれあいなど、一見「生産性のない」と思われるような行動が、世界中の人びとの心を癒す効果を持ったことを指摘しています(元記事)。ただし、今回の記事では、このような『あつ森』の心理的効果ではなく、美術館・図書館・博物館など世界中の文化機関が、自らが所有する文化財の画像データを『あつ森』
メトロポリタン美術館が660冊の絵集をオンラインで公開。北斎の『富嶽百景』や『北斎漫画』もメトロポリタン美術館は、同館が所蔵する日本の絵集650冊をオンラインで公開した。すべてのデータがダウンロードできる。 葛飾北斎『富嶽百景 二編』より パブリック・ドメインの作品画像などの公開を世界でいち早く進めているメトロポリタン美術館が、同館所蔵の日本の古典絵集660冊を無料開放した。 公開されたのは、18〜19世紀につくられた絵集で、葛飾北斎や喜多川歌麿、歌川広重、河鍋暁斎といった日本でも人気の高い絵師たちの作品集がラインナップされている。もっとも多いのは北斎で、107作品を掲載。次いで歌麿が26点、菱川師宣が22点などとなっている。 葛飾北斎『傳神開手 北斎漫画初編』より こうしたデータは、すべてオンラインで閲覧できるのはもちろん、ページごとに画像として保存することもできる。 現物では見れないよ
いま、日本近世研究、とくに文学研究のあたりがすごいことになっています。膨大な国費が投入されて数十万点の日本の歴史的典籍がデジタル化・公開されてしまっていますが、大半は江戸時代の版本のようですね。そして、さらに、そこに書かれたくずし字にOCRをかけたテキストが無料で公開されようとしており、一方で、グーグルが雇用している研究者が、フリーソフトでくずし字OCRソフトやアプリを開発・公開してくれています。さらに、お金があれば、凸版印刷もくずし字のテキスト化をしてくれるそうです。こういった流れを受けて、12月にはイギリスでもThe Digital Turn in Early Modern Japanese Studiesというシンポジウムが開催されるそうです。 実際のところ、そんなこと頼んでないのに…と思っておられる研究者の方々も多いのではないかと思います。が、他の周辺分野からみると、うらやましいと
アジア歴史資料センターで公開している資料は、歴史研究だけではなく、映像作品やテレビ番組の制作における時代考証など、様々な分野で活用されています。そこで、アジ歴ニューズレター第30号の特別企画として、映画監督であり、航空史研究者でもある片渕須直氏に、自身の作品や研究と、アジ歴資料とのかかわりについてお話をうかがいました。 プロフィール 片渕須直(かたぶち・すなお) 1960年大阪府枚方市生れ。日本大学芸術学部映画学科卒。アニメーション映画監督。監督デビュー作は『名犬ラッシー』(「世界名作劇場」)。その他の主な監督作品に『BLACK LAGOON』、劇場公開作品に『アリーテ姫』『マイマイ新子と千年の魔法』『この世界の片隅に』。『この世界の(さらにいくつもの)片隅に』が2019年12月20日公開予定。航空ジャーナリスト協会会員。 ―片渕監督は最初、航空史研究のためにアジ歴を利用されていたとのこと
毎日新聞社は18日、日中戦争や太平洋戦争中に戦地にいた特派員らが撮影した写真やネガを活用し、当時の状況を視覚的に分かりやすくまとめた「デジタルアーカイブ」の開発計画を発表した。渡邉英徳・東京大大学院教授、貴志俊彦・京都大教授らとの共同研究として、戦後80年にあたる2025年の完成を目指す。 対象の写真は、戦時中に中国大陸や東南アジアなどで撮影された6万点余。戦闘だけでなく兵士の日常や街の風景、特派員の取材風景なども収められている。終戦前後に軍から焼却命令が出たが、当時の社員が大阪本社の地下などに隠し、これまで保管されてきた。 18日は東京大情報学環・福武ホール(東京都文京区)で共同研究発表会が開かれ、毎日新聞社の「戦中写真アーカイブ委員会」委員長、末次省三執行役員があいさつ。鯨岡秀紀・大阪本社編集局長が、資料の特徴や研究の意義を説明した。
アプリのインストール Android: Google Play - 「みを」で検索 iOS: App Store - 「みを」で検索 2021年8月30日、Android版とiOS版のアプリを正式公開しました。アプリの利用は無料です。くずし字資料をカメラで写真撮影し、認識ボタンを押すだけで、AIがくずし字を現代文字に変換してくれます。Google PlayまたはApp Storeからインストールし、スマートフォンやタブレットなどでご利用下さい。 [もっと詳しく..] 「みを」アプリに関する情報をシェアする際には、ハッシュタグ「#miwoapp」をお使いください。 X (Twitter) - #miwoapp 主な機能 ご利用にあたって 「みを」のご利用にあたっては、プライバシーポリシー/利用規約や、注意事項をお読みください。 「みを」のAIくずし字認識は決して完璧ではありません。くずし字認
《この記事は約 21 分で読めます(1分で600字計算)》 少し遅くなってしまいましたが改めて、新年あけましておめでとうございます。 2022年も HON.jp News Blog をどうぞよろしくお願いいたします。 毎年恒例、編集長 鷹野凌による出版関連の動向予想です。 2021年の予想と検証 2021年の予想は、以下の5つでした。自己採点の結果を右端に付けておきます。 出版社系ウェブメディアの飛躍 → ○ 既刊の電子化が急がれる(というか急げ) → ○ 描き手争奪競争の更なる激化 → ○ 電子図書館サービスの普及がついに始まる → ◎ 映像コンテンツの需要がより高まる → ○ コロナ禍が簡単には沈静化せず、「2020年3月以降に起きた劇的な社会的変化は2021年も継続し、感染予防のため身体的な接触機会を減らすべく、さまざまなことの“遠隔化”は今後も急速に進む」という社会環境も含め、おお
概要 ノートブック 実行方法 入力フォルダの準備 ノートブックの実行:1.初期セットアップ ノートブックの実行:2.設定 ノートブックの実行:3.実行 まとめ 追記 2022.05.02 2022.04.30 概要 前回、Google Cloud PlatformのCompute Engineを用いたNDLOCRアプリの実行方法を共有しました。 nakamura196.hatenablog.com ただし、上記の方法は手続きが一部面倒で、かつ費用がかかる方法です。本番環境で使用するには適した方法ですが、小規模に、または試験的に使用するにはハードルが高い方法でした。 この課題に対して、 @blue0620 さんがGoogle Colabを用いたNDLOCRアプリの実行方法を作成されました。 https://twitter.com/blue0620/status/151929433215901
キンコーズ・ジャパン株式会社(本社:東京都港区、代表取締役社長:渡辺 浩基、以下 キンコーズ)は、国立国会図書館が今年3月に公開した、同館所蔵の日本画、浮世絵、伝統模様などをデジタル化し収録した「NDLイメージバンク」に掲載された画像をプリントできるサービス*を、2022年8月1日から、キンコーズ・新宿南口店で開始します。 貴重な文化財を身近な衣類や日用品にプリント 「NDLイメージバンク」に掲載されている画像はすべて著作権保護期間を満了しており、グッズ作成などに利用することが可能です。そこで、キンコーズ・新宿南口店では「NDLイメージバンク」のコンテンツを閲覧、ダウンロードできる専用PCを店内に用意し、Tシャツやトートバッグといった衣類をはじめ、コースターなどの日用品に直接プリントできるサービス*を開始することにしました。四季の行事や風物を描いた江戸の浮世絵や、日本が誇る美しい風景画、大
女優の草刈民代(57)が5日、国会内で開かれた「デジタルアーカイブが拓く日本の社会・文化芸術の未来」(デジタルアーカイブ学会法制度部会主催シンポジウム)に出席した。 同学会は、社会として歴史的資料の記録を保存・整備することの意義を伝え、デジタルアーカイブによる社会の発展、特に文化芸術、エンターテインメント政策の今後のあり方の推進に取り組んでいる。 シンポジウムには草刈のほか、映画監督・プロデューサーで元テレビディレクターの大島新氏、同学会会長で東京大学院教授の吉見俊也氏、弁護士の福井健策氏が登壇し、ディスカッションを行った。 バレリーナとしても活躍した草刈は「諸外国のアーカイブの在り方、政治・社会・文化政策との関連性」について言及。フランスの「パリ・オペラ座」のバレエの歴史などを参考に、日本のアーカイブ構築に向けて大切な要素として「アーカイブは選別するのではなく、全量保存が新しい文化を作る
新型コロナウィルス(COVID-19)のパンデミック(世界的大流行)により、各国の政府は“social distancing(社会的距離)”対策として、国民に対して、行動を制限し、不要な接触を控えるよう呼びかけている。これを受け、外出を禁じられている子供たちが自宅で楽しく過ごせるよう、多くの博物館や図書館が所蔵するユニークな塗り絵の冊子を、無料でダウンロードすることが可能になった。 2016年以来、『ニューヨーク医学アカデミー』が世界各国の図書館、文化機関やアーカイブに対し、個々で取り揃えている著名なコレクションをテーマとしたプリント可能なPDF形式のページの提供を呼びかけてきた。現在多くの人々が自宅謹慎を余儀なくされている状況を受け、『ニューヨーク植物園』を筆頭に, 『スミソニアン博物館』や、イギリスの『オックスフォード大学』など100以上の団体がこのプロジェクトに参加している。ハイライ
なお、地名数がゼロの地図は他の地図の拡大版のため、今のところ作業予定はありません。 データセット 江戸マップデータセット 江戸マップβ版の地名をまとめて利用するためのデータセットです。 江戸マップデータセット 江戸マップ「れきちず」データセット 江戸マップβ版から抽出したデータを「れきちず」に統合するためのデータセットです。 江戸マップ「れきちず」データセット 参考文献 北本 朝展, 鈴木 親彦, 寺尾 承子, 堀井 美里, 堀井 洋, "地理的史料を対象とした歴史地名の構造化と統合に基づく江戸ビッグデータの構築", 人文科学とコンピュータシンポジウム じんもんこん2020論文集, pp. 171-178, 2020年12月 [ Paper ] 更新情報 2024-05-01 江戸マップ「れきちず」データセットを公開しました。 2023-10-20 既存の地名を2件修正しました。 2023
このたび、一般財団法人人文情報学研究所より、「蔵書印ツールコレクション」が公開されました。 https://seal.dhii.jp/ 構築の経緯など、詳しくは「蔵書印ツールコレクションについて https://seal.dhii.jp/about/」をご覧ください。 このツールコレクションの目玉は、18万字の篆字画像を用いたディープラーニングによる篆字画像検索です。篆書で読めない蔵書印を、1文字でも2文字でも、画像で文字検索することで文字単位での確認を支援するものです。文字が確認できたら、そこから今度は蔵書印データベース検索にジャンプすることで、蔵書印そのものの検索もできるようになっています。すでに蔵書印データベースに登録されているものであれば、そこで同じ蔵書印を見つけることができるかもしれません。この使い方に関しては解説動画もありますので、そちらもご覧になるとよいかと思います。 このツ
2022年3月22日、国立国会図書館(NDL)のNDLラボが、「次世代デジタルライブラリー」の全文検索対象を著作権保護期間が満了した図書資料全件約28万点に拡大したと発表しました。 2022年度にNDLが実施しているデジタル化資料の光学文字認識(OCR)テキスト化事業の成果物の一部であり、技術的検証の実施や成果の迅速な提供のため、国立国会図書館デジタルコレクションの全文検索機能とは別に提供しているとあります。 「次世代デジタルライブラリー」の全文検索対象を著作権保護期間満了図書資料全件に拡大しました(NDL Lab, 2022/3/22) https://lab.ndl.go.jp/news/2021/2022-03-22/ 参考: 国立国会図書館、「次世代デジタルライブラリー」の全文検索対象拡大と画像検索機能改善を実施 Posted 2022年2月1日 https://current.n
"../../../../", "title" => "作家・片岡義男小説(449作品)、国立国会図書館の電子閲覧公開へ|VOYAGER-Pressrelease", "tabnum" => 3, "style" => "dark", "meta" => "name='description' content='ボイジャーは『片岡義男 全著作電子化計画』の一環として、同氏の小説449作品を「国立国会図書館デジタルコレクション・国会図書館内限定」へ提供いたしました'", "extra" => ' ', "goback" => "../../../../info.html" ]; include('../../../../home/head.html'); ?> 作家・片岡義男小説(449作品)、国立国会図書館の電子閲覧公開へ 株式会社ボイジャー(本社:東京都渋谷区神宮前、代表取締役:鎌田純子
新着情報 2024.3.10 2024.1.30に更新された基盤地図情報5mメッシュDEMを標高タイルに加工し全国Q地図MapLibre版で公開しました。 2024.2.24 全国Q地図MapLibre版で傾斜量図を表示できるようになりました。基盤地図情報1mメッシュDEMを標高タイルに加工し全国Q地図MapLibre版で公開しました。 2024.2.12 1:2,500八女市都市計画基本図、1:5,000八女市基本図、1:2,500小竹町基本図、1:10,000小竹町全図の公開を開始しました。 2024.2.5 全国Q地図MapLibre版で段彩図を表示できるようになりました。 2024.1.28 2023年9月 地理院地図(標準タイル)の公開を開始しました。 2024.1.21 令和6年能登半島地震の被災地域の地震前の様子が詳細に確認できるよう、2020、2022年の空中写真(簡易オル
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く