タグ

ブックマーク / digitalnagasaki.hatenablog.com (23)

  • NDL古典籍OCRによって漢文仏典研究環境が飛躍的に便利に: - digitalnagasakiのブログ

    表題の通りのことを実現できましたので、とりあえずこちらにてご報告です。 やや説明が難しいのですが、何ができるように/便利になったのかというと、 「SAT大蔵経DBのテキストをクリックするだけでそれに対応する宮内庁宋版一切經の行や東京大学嘉興蔵の行がそれぞれ拡大表示される」機能が追加された、というものです。(最近はシステムを他の人に作っていただくこともありますが、今回は表示システムの部分は全部自分で作っています) SAT大蔵経DBはこちらです。 そして、この位置合わせを行うにあたって、NDL古典籍OCRで生成したテキストデータが非常に役立った、ということなのです。 例として、以下のURLで表示可能な経典を用いてみます。 21dzk.l.u-tokyo.ac.jp 先に具体的な使い方をご説明しますと、今回、下記のところに新たにチェックボックスが2つ追加されました。 たとえば、上記のように「宮内

    NDL古典籍OCRによって漢文仏典研究環境が飛躍的に便利に: - digitalnagasakiのブログ
  • デジタルデータの長期保存:iPRES2022 基調講演の日本語訳が公開されました - digitalnagasakiのブログ

    デジタルデータはなくなってしまいやすい…という話を時々耳にします。実のところ、紙媒体と同じくらいの手間をかけてよいのであればデジタルデータの持続可能性は十分に高いと思うのですが、そうだとしても、よりよくきちんと長期保存するためには何らかのルールを作っておいた方が安全です。というのは、なくならないけど読めなくなった、とか、読めるけど誰がいつ作ったものかはよくわからない、膨大過ぎてもう何がなんだかわからない…等々、保存しておくだけでは済まない落とし穴が色々あるからです。これも紙媒体と共通する事項が多いので、紙媒体でどうしてきたかということを確認しながら考えるのはとても重要なのですが、やはりデジタルに固有の課題もありますので、紙媒体での事情を踏まえつつデジタル媒体の特性もきちんと押さえた保存のための手続きのようなものがあるとありがたいところです。 そのような課題については、すでにOAIS参照モデ

    デジタルデータの長期保存:iPRES2022 基調講演の日本語訳が公開されました - digitalnagasakiのブログ
  • AIの助けを借りて蔵書印を解読/蔵書印ツールコレクションの公開 - digitalnagasakiのブログ

    このたび、一般財団法人人文情報学研究所より、「蔵書印ツールコレクション」が公開されました。 https://seal.dhii.jp/ 構築の経緯など、詳しくは「蔵書印ツールコレクションについて https://seal.dhii.jp/about/」をご覧ください。 このツールコレクションの目玉は、18万字の篆字画像を用いたディープラーニングによる篆字画像検索です。篆書で読めない蔵書印を、1文字でも2文字でも、画像で文字検索することで文字単位での確認を支援するものです。文字が確認できたら、そこから今度は蔵書印データベース検索にジャンプすることで、蔵書印そのものの検索もできるようになっています。すでに蔵書印データベースに登録されているものであれば、そこで同じ蔵書印を見つけることができるかもしれません。この使い方に関しては解説動画もありますので、そちらもご覧になるとよいかと思います。 このツ

    AIの助けを借りて蔵書印を解読/蔵書印ツールコレクションの公開 - digitalnagasakiのブログ
  • 京大OCW閉鎖の件に寄せて:これからの可能性だったものの一つ - digitalnagasakiのブログ

    京都大学高等教育研究開発推進センターが9月末に廃止されることに伴い、「京都大学オープンコースウェア(OCW)」が閉鎖されるというニュースに接した。実際のところ、これがその後どうなるのかはわからないが、現在知らされている範囲では、とにかくなくなってしまうようだ。 基的に、Webコンテンツの持続可能性について、私は、「とにかく再利用可能なライセンスをつけておけば存続できる」という点を大切にしているのだが、それは必ずしもうまくいかない面がある。貴重資料の画像で、それにメタデータを付与して一緒に流通させ、ハッシュでデータの改ざん可能性を管理したりすれば、さらに、そもそもIPFSでなんとかすれば、と考えたりしつつ色々なことを試しているのだが、しかし、オープンコースウェアの場合、またちょっと話が変わってくる。オープンコースウェアは基的になまものの教育コンテンツを志向するものであり、それ単体で価値を

    京大OCW閉鎖の件に寄せて:これからの可能性だったものの一つ - digitalnagasakiのブログ
  • 翻訳は研究業績にならないの? - digitalnagasakiのブログ

    少し前に、パワポ資料は研究業績にならないのか、という記事を書きましたが、 最近、以下のツィートを拝見しましたので、今度は、翻訳はどうなのか、ということについて少し思うところを書いてみたいと思います。 いつからでしょう、学術の世界で翻訳が研究者の業績としてカウントされなくなってしまったのは。自分の世代で考えると、サイードやフーコーなどの翻訳がなかったら、多くの英米文学が翻訳で読めなかったら、今の自分はあるのかとか真剣に考えてしまう。翻訳文化は学術の基礎研究のはずなのに。— Yoshiyuki Kido (@ykido66) 2021年8月20日 まず、細かいところに突っ込むようですが、しかしこの種の事柄を検討する上で大事なポイントだと思うので 抑えておきたいのが、 「研究者の業績」を「カウント」するということ自体が、少なくともここで問題になりそうな 人文系においては割と最近のことだったのでは

    翻訳は研究業績にならないの? - digitalnagasakiのブログ
  • 書物のグローバルな歴史における日本の位置付け - digitalnagasakiのブログ

    今夜は慶應義塾ミュージアム・コモンズのシンポジウム「KeMCo国際シンポジウム|景——書物文化がつくりだす連想の風景」を 拝聴して勉強させていただいた。 前大英図書館収書・司書部長のクリスチャン・イエンセン氏、トロント大学の中世英文学教授、アレクサンドラ・ギレスピー氏、オクスフォード大学ボドリアン日研究図書館長のアレッサンドロ・ビアンキ氏という豪華な海外メンバーに加えて、日からも松田隆美氏、佐々木孝浩氏、徳永聡子氏、という豪華メンバーに加えてディスカッションは間友氏が仕切るという、慶應大学の盤石さを感じさせる素晴らしい構成のシンポジウムだった。 ベンヤミンのアウラを媒介としてミュージアムと図書館における価値の在り方の違いを明快に示した冒頭のイエンセン氏の講演は、このシンポジウムのみならず、ミュージアム・コモンズや、さらに、議論の場の形成に課題を抱える日のデジタル・アーカイブにヒン

    書物のグローバルな歴史における日本の位置付け - digitalnagasakiのブログ
  • デジタルアーカイブ学会賞授賞を機に『日本の文化をデジタル世界に伝える』を改めてご紹介 - digitalnagasakiのブログ

    昨秋、『日文化をデジタル世界に伝える』という著書を刊行した。このブログでは刊行の経緯について触れたことがあり、また、大学院生の方々による紹介記事を掲載したことがあったが、内容について、自分ではあまり触れなかった。このが、ありがたくもデジタルアーカイブ学会の賞をいただくことになり、最近、そのための挨拶文を書くという機会があり、また、少し前に、ありがたいレビューをいただいたこともあり、改めてこのが伝えようとしていることについてちょっと記しておきたい。 書は、端的に言えば、文化資料デジタルアーカイブの構築・運用を扱うものである。そして、技術的な事柄を基礎として、そこから立ち上げってくる種々の課題に ついて解説したものである。近年デジタルアーカイブにおいて中核的なものとなってきているWeb技術は日進月歩だが、同時に、常にその技術的制約によって 提供者・利用者ができることが変わり続けている

    デジタルアーカイブ学会賞授賞を機に『日本の文化をデジタル世界に伝える』を改めてご紹介 - digitalnagasakiのブログ
  • オンデマンド配信での著作物の教育利用に向けて? - digitalnagasakiのブログ

    以下の件につき、識者の方々にご教示いただいた結果、SARTRASに補償金さえ支払えば、利用者側としてはその向こう側を特に気にする必要はないという立て付けになっていると理解しました。 色々気になるところではありますが、したがいまして、以下の件は素人の想像+勉強不足ということでご放念ください。 この件は素人ですので、あとで修正する可能性があることをご容赦ください。 一昨日、以下のニュースが流れました。 headlines.yahoo.co.jp 著作権法第35条にて、教育の情報化に対応した権利制限規定の整備を目指して 「授業目的公衆送信補償金に係る指定管理団体」を介して著作権者等に補償金(「授業目的公衆送信補償金」)を受ける権利を付与することになった のだそうで、ユーザレベルでは、この団体に補償金を支払えば教育機関における利用においてオンデマンド配信でも 著作権者等の許諾を得ることは必要なくな

    オンデマンド配信での著作物の教育利用に向けて? - digitalnagasakiのブログ
  • みなさんのオンライン授業に向けた取り組み - digitalnagasakiのブログ

    いよいよ、オンライン授業に向けたみなさんの取り組みが活発になってきたようです。ツィッタを見ているだけでも色々なチャレンジや検討事項が流れてきていて、それが非常に具体化してきているのがとても面白いです。懐疑的な人も問題点を感じている人も、とにかくやろうとしてみているようであることは頼もしいことです。手元の機材や自分の授業ポリシーに応じて、私には思いつかなかったようなことをしておられる人もちょこちょこ見受けられて、取り組む人が増えると多様性が生じるということを改めて実感しているところでもあります。 そんな中で、特にこれはと思ったツィートをいくつかまとめてみました。 まずは、教壇に立って普通に授業をしている状況を配信しようとしてられる方々がおられました。書いたものをみせるのはパワポかGoogle Docsと思い込んでいた自分にとっては なかなか新鮮でした。 大人数講義を想定して録画or配信のテス

    みなさんのオンライン授業に向けた取り組み - digitalnagasakiのブログ
  • デジタルアーカイブでの画像の取り扱いにお悩みの方へ:Goobiその1 - digitalnagasakiのブログ

    2日間、京都大学で開催されたデジタルアーカイブ学会が終了し、みなさまそれぞれに課題を持ち帰られたことと思います。かくいう私も、色々な方の発表をおうかがいし、様々な示唆をいただいたところでした。具体的な実践の発表から得られる情報と教訓も、いつもながら貴重なものがありました。 ところで、初日の懇親会の後、一部有志で集まり、Goobiというソフトウェアの使い方の検討会を行いました。参加メンバーは、敬称を略させていただきますが、大西亘(神奈川県立生命の星・地球博物館)、岡田一祐(国文学研究資料館)、亀田尭宙(京都大学)、中西智範(早稲田大学)、中村覚(東京大学)、宮隆史(東京大学)+永崎という感じで、この便利なソフトを日でデジタルアーカイブ関連の仕事をしている方々がみんなで使って仕事を効率化できるようにするには(=みんなで幸せになるためには)どうしたらいいのか、和気藹々と喫茶店で皆で深夜までノ

    デジタルアーカイブでの画像の取り扱いにお悩みの方へ:Goobiその1 - digitalnagasakiのブログ
  • オープンライセンス表示に一工夫を - digitalnagasakiのブログ

    あけましておめでとうございます。2018年も色々ありましたが、国立国会図書館デジタルコレクションでIIIFが採用されるという、業界的には大きな出来事がありましたね。IIIFは元々、フランス国立図書館・英国図書館が言い出しっぺに名を連ねている上に、バイエルン州立図書館でも採用して、米国議会図書館でも2018年6月にはIIIFカンファレンス(年次総会)を開催することになっていて…というタイミングで、ようやく日の国立国会図書館もデジタル化資料共有の輪の中に入ってくれたということで、ほっと一安心の2018年でした。がんばってくださった関係者の方々には感謝すること至極です。 ところで、この業界をしばしば熱くさせるパブリックドメイン資料の公開とその扱いについて、昨年、少し面白い話がありました。私も少しだけ話をさせていただいた、東京大学学術資産アーカイブ化推進室によるセミナーでのことだったのですが、著

    オープンライセンス表示に一工夫を - digitalnagasakiのブログ
  • 京大附属図書館IIIF対応と新日本古典籍総合データベースの右⇒左対応 - digitalnagasakiのブログ

    ついに、待ちに待っていた京都大学附属図書館からのIIIF対応デジタルコレクションが公開されたようです。「京大貴重資料デジタルアーカイブ」だそうです。素晴らしいことです。 京都大学附属図書館は、東京大学大学院人文社会系研究科人文情報学拠点に続いて、日からIIIFコンソーシアムに加盟した、まだ日には2つしかない組織の一つであり、筆者としては、ここからのIIIF対応コンテンツの公開を心待ちにしていたのでした。多様な資料がIIIF対応で公開されていて、見ているとなかなか楽しいものですね。私の好きな南瞻部洲万国掌菓之図も公開されていて、ちょっとテンションがあがります。コンテンツの豊富さもさることながら、公開に際しては、MiradorとUniversal Viewerという、IIIF対応の二大ビューワのどちらにも対応している上にIIIF Dropアイコンも用意してらっしゃるので、至れり尽くせりの対

    京大附属図書館IIIF対応と新日本古典籍総合データベースの右⇒左対応 - digitalnagasakiのブログ
  • IIIFの導入方法のまとめ(コンテンツホルダー・一次公開者向け) - digitalnagasakiのブログ

    IIIFの導入の仕方がよくわからない、という声を結構あちこちで聞きます。ブログ記事として断片的に書いてきているのですが、それをいちいち探して読んでいただくのも大変ですので、改めて簡潔に記しておきます。ただし、既存のサーバ環境やサーバ・ネットワーク運用ポリシーによってできることは結構違ってくることがありますので、その点はよくご注意ください。 それから、IIIFの場合、「導入」と言っても、コンテンツホルダーや一次公開者向けの「導入」とは別に、既存の公開IIIFコンテンツを素材とする二次利用公開という観点での「導入」があります。これは今までは「利活用」と呼ばれてきたものだと思いますが、たとえば地図年表上に他所のIIIFコンテンツをマッピングできるシステムの例などをみますと、もはや「導入」と言ってしまってもいいような雰囲気があるように思っております。が、ここでは、あくまでも、一次公開者向けの導入方

    IIIFの導入方法のまとめ(コンテンツホルダー・一次公開者向け) - digitalnagasakiのブログ
  • 公開されているIIIFコンテンツを収集・共同編集するツールがリリースされました - digitalnagasakiのブログ

    メールマガジン人文情報学月報のイベントレポートで何度か触れてきましたが、トロント大学図書館の「写研究のためのデジタルツール」プロジェクトで開発されていた、「既存のIIIFコンテンツを収集・共同編集するツール」が、ついに公式リリースされました。このツールに関するGithubのページに、使い方に関する説明も一通り用意されていますので(ただし英語ですが)、基的な使い方はそちらを見ていただくとしまして、ここでは、そのインパクトを感じられるようなご紹介をしてみたいと思います。 これまで筆者はIIIFの紹介をあちこちでしてきておりまして、その時によく言われたことは「Miradorでアノテーション付けられるのはいいけどそれは共有できるの?」ということだったのですが、それについての筆者の答えは 「今のところ標準ではローカルに保存されます。が、ちょっといじればサーバに保存して共有することもできます。詳し

    公開されているIIIFコンテンツを収集・共同編集するツールがリリースされました - digitalnagasakiのブログ
  • デジタルアーカイブにおけるテクスト資料の扱い: 図書館向けのTEI活用法 - digitalnagasakiのブログ

    前回記事に続けてもう一つ、デジタルアーカイブにおけるテクスト資料の扱いについての記事です。 ここまで、このブログでTEIに関する話を読んできていただくと、「そんなに細かいタグを付けるのは大変だ」と思ってしまわれる人も結構おられるのではないかと思います。しかし、TEIでは、必ずしも細かく深いタグをつけていかねばならないというものではなく、浅いマークアップ(タグ付け)でもTEIであると言えますし、それでも一定の機能を果たすことはできます。 特に、こういったことについて関心があるのは、やはり図書館の方々のようです。デジタル化はするが、内容にあまり深入りすることははばかられる、あるいは、時間的コスト的に内容のタグ付けなどはさすがにちょっと無理、というような状況は、世界中のどこにでもあるようで、しかし、それでもテキストデータを書誌情報とともにうまく流通させるにはTEIを使っておくことが後々有益だろう

    デジタルアーカイブにおけるテクスト資料の扱い: 図書館向けのTEI活用法 - digitalnagasakiのブログ
  • 国立公文書館で紹介された「最新のIT技術を活用したデジタルアーカイブ・システムの調査検討報告書」について気がついたこと - digitalnagasakiのブログ

    ところで、先日、国立公文書館から、 最新のIT技術を活用したデジタルアーカイブ・システムの調査検討報告書(平成29年1月)(PDF) というものが公開されたようで、「調査・報告書等」のページから閲覧できるようになっています。前の記事にてご紹介したブログを公開しているインフォコム株式会社さんの名前が最初のページに書いてあるので、インフォコムさんが作成されたのでしょうか?この調査報告の発注した文書などを確認すればわかるのだと思いますが、それは、どなたか、識者の方にご教示いただけますとたいへんありがたく存じます。 内容的には頑張って色々まとめておられて、「最新のIT技術(情報技術技術?)を活用した」というにはそんなに最新な感じはしませんが、現状を把握するにはよい文書なのではないかと思います。細部には色々気になる点もありますが、そういうところには突っ込みを入れつつ、これを使って読書会などをしてみる

    国立公文書館で紹介された「最新のIT技術を活用したデジタルアーカイブ・システムの調査検討報告書」について気がついたこと - digitalnagasakiのブログ
  • 「デジタルアーカイブ」を考える―「日本」がそのアイデンティティを取り戻すために - digitalnagasakiのブログ

    「デジタルアーカイブ」に関わる技術について、このブログでは主に扱ってきている。基的に目指しているのは、そういう情報をきちんと共有して、「車輪の再発明」を避けつつ、無駄な投資も避けて、「デジタルアーカイブ」が適切な歩みを進めていくことに少しでも役立てばと思って、ブログだけでなく、呼ばれれば世界中どこでも参上して情報提供してきている。できれば交通費は出していただけるとありがたいが、大きな波及効果が見込まれる重要な会合なのにどうしても交通費を出せなければこちらの負担でおうかがいすることもやぶさかではない。 しかしながら、なぜ、自分がそういうことをしているのか、それによって何を目指しているのか、ということについてはあまり書いたことがなかったので、2ちゃんねる用語で言うところのチラ裏になってしまう上に、やや断片的になってしまうが、特に、最近重点的に考えていることを少しだけ書いておきたい。 明治維新

    「デジタルアーカイブ」を考える―「日本」がそのアイデンティティを取り戻すために - digitalnagasakiのブログ
  • 「デジタルアーカイブ」における画像共有のための国際規格IIIFについてのご紹介(続) - digitalnagasakiのブログ

    IIIF International Image Interoperability Framework 国際的な画像相互運用の枠組み 断片的な紹介ばかりで恐縮だが、IIIFのメリットが見えにくい、先の見通しが見えにくい、という話をいただくことが多いので、もう少しわかりやすくなるようにまとめ直してみたい。 IIIFは、その名の通り、Web上での画像のやりとりの仕方を効率化するための手法であり、それ以上でもそれ以下でもない。これがそのままデジタルアーカイブの基幹部分として使えるという風に考えてはいけない。基幹的なデジタルアーカイブを前提として、その画像やその他のデータをやりとりしやすくするための仕組みなのである。その観点からみれば、これまでにはなかった部分を埋める規格であると言える。 では、画像のやりとりの仕方がどのように効率化されるのか。大きなポイントは2点だが、その結果、様々な面での効率化

    「デジタルアーカイブ」における画像共有のための国際規格IIIFについてのご紹介(続) - digitalnagasakiのブログ
  • 今、まさに広まりつつある国際的なデジタルアーカイブの規格、IIIFのご紹介 - digitalnagasakiのブログ

    ※IIIFの情報を求めてこちらに来られた方は、「IIIF日語情報私的まとめ」もご覧ください 現在、デジタルアーカイブにおいて画像を公開し共有するための国際的な枠組みが作られ、採用が広まりつつあります。International Image Interoperability Framework、略してIIIF(トリプルアイエフ)というもので、英国図書館、フランス国立図書館、オックスフォード大学ボドリアン図書館、スタンフォード大学、プリンストン大学、イェール大学など、錚々たる機関が始めた規格で、国立国会図書館のカレントアウェアネスポータルでも何度か簡単に紹介されているようです。 これまで、デジタルアーカイブに関する大きな難点の一つであった、「各地のデジタルアーカイブで個別に公開されて、いちいちそれぞれのサイトの使い方を覚えなければならず、使い勝手も善し悪しが大きく異なる」という状況が、III

    今、まさに広まりつつある国際的なデジタルアーカイブの規格、IIIFのご紹介 - digitalnagasakiのブログ
  • 北米大学図書館の日本研究司書の人たちの危機感を実感した話 - digitalnagasakiのブログ

    今、いくつか原稿を抱えていて、当ならこれを書いている場合ではないのだが、しかし、この感触を忘れないうちに記しておきたい。 北米大学図書館の日研究司書の人たちの危機感を実感した という話。 特に、ミシガン大学日研究司書の横田カーター啓子さんやハーバード燕京図書館研究司書のマクヴェイ山田久仁子さんからよくおうかがいする話で、他の北米日研究司書の方々からもちょこちょこおうかがいする話として 「中国韓国(多分台湾も)はネットで資料が手に入るけど日は全然ネットで手に入らないからこのままだと利便性で圧倒的に負けていて若い人がそれを理由に離れていってしまいかねない」 という、割と、日の将来にとって危機的な話がある。これは、江上敏哲さんが彼のご著書『棚の中のニッポン 海外の日図書館と日研究』をはじめとしてあちこちでしておられる話でもある。そこら辺の事情を知る人なら誰でも感じる危機感で

    北米大学図書館の日本研究司書の人たちの危機感を実感した話 - digitalnagasakiのブログ