タグ

ブックマーク / digitalnagasaki.hatenablog.com (8)

  • それでも高度なデジタルアーカイブを提供したい時は:「一次公開」「二次公開」とIIIF - digitalnagasakiのブログ

    以下の、前回記事の続きです。 digitalnagasaki.hatenablog.com こちらの記事では、新しいことや難しいことをすると大変だ、という話ばかり書きましたので、がっかりした人もおられるかもしれません。 たしかに、良コンテンツを持っているところでなければ高度なデジタルアーカイブの提供はできませんし、単体では良コンテンツとは言えないものでもある程度の規模で集約することによって価値を高めることができるのはよくあることです…というのは、IIIF (International Image Interoperability Framework) 登場以前の話でした。今はそう考える必要がありません。 IIIFの枠組みでは、このルールに従って公開された画像は、この枠組みに準拠したより良いツールが登場したら、そのツールに切り替えることができます。それは、デジタルアーカイブ提供者だけでなく、

    それでも高度なデジタルアーカイブを提供したい時は:「一次公開」「二次公開」とIIIF - digitalnagasakiのブログ
    tokg
    tokg 2024/07/05
  • NDL古典籍OCRによって漢文仏典研究環境が飛躍的に便利に: - digitalnagasakiのブログ

    表題の通りのことを実現できましたので、とりあえずこちらにてご報告です。 やや説明が難しいのですが、何ができるように/便利になったのかというと、 「SAT大蔵経DBのテキストをクリックするだけでそれに対応する宮内庁宋版一切經の行や東京大学嘉興蔵の行がそれぞれ拡大表示される」機能が追加された、というものです。(最近はシステムを他の人に作っていただくこともありますが、今回は表示システムの部分は全部自分で作っています) SAT大蔵経DBはこちらです。 そして、この位置合わせを行うにあたって、NDL古典籍OCRで生成したテキストデータが非常に役立った、ということなのです。 例として、以下のURLで表示可能な経典を用いてみます。 21dzk.l.u-tokyo.ac.jp 先に具体的な使い方をご説明しますと、今回、下記のところに新たにチェックボックスが2つ追加されました。 たとえば、上記のように「宮内

    NDL古典籍OCRによって漢文仏典研究環境が飛躍的に便利に: - digitalnagasakiのブログ
  • デジタルデータの長期保存:iPRES2022 基調講演の日本語訳が公開されました - digitalnagasakiのブログ

    デジタルデータはなくなってしまいやすい…という話を時々耳にします。実のところ、紙媒体と同じくらいの手間をかけてよいのであればデジタルデータの持続可能性は十分に高いと思うのですが、そうだとしても、よりよくきちんと長期保存するためには何らかのルールを作っておいた方が安全です。というのは、なくならないけど読めなくなった、とか、読めるけど誰がいつ作ったものかはよくわからない、膨大過ぎてもう何がなんだかわからない…等々、保存しておくだけでは済まない落とし穴が色々あるからです。これも紙媒体と共通する事項が多いので、紙媒体でどうしてきたかということを確認しながら考えるのはとても重要なのですが、やはりデジタルに固有の課題もありますので、紙媒体での事情を踏まえつつデジタル媒体の特性もきちんと押さえた保存のための手続きのようなものがあるとありがたいところです。 そのような課題については、すでにOAIS参照モデ

    デジタルデータの長期保存:iPRES2022 基調講演の日本語訳が公開されました - digitalnagasakiのブログ
  • デジタルアーカイブのためのプログラミングレッスン第一回~第四回 - digitalnagasakiのブログ

    デジタルアーカイブのためのプログラミングレッスン、というのを少し作成してみています。今のところ、第一回~第四回ができております。 デジタルアーカイブに興味を持ったり、関わったりしているものの、内容面だけでなく技術面からも格的に取り組もうと思って普通に一からプログラミングを勉強しようとすると、何に役立つのかのイメージを持ちにくくてなかなか気が進まない、という経験をお持ちの方は少なくないと思います。 そんな弱まりがちな気持ちをブーストするために、あるいは、かつてやめてしまったことに再挑戦するために、ちょっと直接的に役立ちそうなプログラミングのレッスンと課題を、まさに実践経験の場からご用意いたしました。第四回までいくと、任意のNDLコンテンツをMiradorやIIIF Curation viewerで直接開くリンクを作成できるようになります。 これですべてできるようになるというわけではありませ

    デジタルアーカイブのためのプログラミングレッスン第一回~第四回 - digitalnagasakiのブログ
  • 「デジタル人文学」以前の日本の人文系デジタルテキスト研究を探訪してみる - digitalnagasakiのブログ

    日、日デジタル・ヒューマニティーズ学会(JADH)の年次国際学術大会JADH2020が終了しました。リアル開催の予定だったものがバーチャルに途中で変更になり、日程も少し後ろに動かして、それでもなんとかきちんと開催でき、それほど人数は多くないながらも意義のある議論が展開され、相互に認識を深められるとても良い学会になったと思いました。開催を引き受けてくださった大阪大学言語文化研究科の田畑智司先生、ホドシチェク・ボル先生には感謝すること至極です。また、キーノートスピーチを引き受けてくださった東国大学のKim Youngmin先生、IIT インドールのNirmala Menon先生、それから、休日を返上して参加してくださった発表者・参加者の方々のおかげで会も盛り上がりました。大変ありがたく思っております。JADHは、国際デジタル・ヒューマニティーズ連合(Alliance of Digital

    「デジタル人文学」以前の日本の人文系デジタルテキスト研究を探訪してみる - digitalnagasakiのブログ
  • 仏典研究のためのIIIFコンテンツ収集+閲覧サイトを作ってみました - digitalnagasakiのブログ

    今回は、仏典研究のためのIIIFコンテンツを収集して閲覧できるサイト、というのを作ってみました。とりあえず1分くらいお時間がおありの方は以下の動画GIFをご覧になってみてください。 要するに、世界各地のデジタルリポジトリ・デジタルコレクションに少しずつ含まれている仏典関連のIIIF manifestを集めて、IIIF manifest中の文字列で検索できるようにして、さらに、Miradorでクリックするだけで簡単に画像を並べられるようにしたものです。 技術的には特に難しいことはしておらず、最近世間で広まっていてフリーソフトで実現できる一般的な技術を組み合わせただけでこれくらいのことはできます。もう少し具体的には、IIIF manifestをサイトに登録すると、IIIF manifestのJSON形式をたどって文字列が入っているはずの箇所を取り出してから、それらの文字列を一つにまとめて、フリ

    仏典研究のためのIIIFコンテンツ収集+閲覧サイトを作ってみました - digitalnagasakiのブログ
  • IIIFのための画像サーバ導入記(JPEGのままで/Tomcat編) - digitalnagasakiのブログ

    IIIF Image API対応画像サーバ Digilib のインストールについてのご紹介 以前に、IIIFのための画像サーバを導入するための方法として、IIP Image serverをご紹介(簡易版)しました。多分これが最速なのではないかと思うのでとりあえずご紹介したのですが、一方で、ソースコードからのコンパイルが必要になる上に、jpeg2000かTiled Tiffが必要なので画像の準備が大変、ということがありました。そこで、普通のjpeg画像でも使える上にコンパイルする必要もない、Loris というPythonで書かれたサーバソフトがある、という言及だけはいたしました。とはいえ、Pythonはあんまり速くない上に、インストールに際しての依存関係の解決が結構大変で、どうやったか思い出せないほどだったので(Pythonを普段使いしている人には簡単なことかもしれないのですが)、導入記をご

    IIIFのための画像サーバ導入記(JPEGのままで/Tomcat編) - digitalnagasakiのブログ
    tokg
    tokg 2018/02/07
  • IIIFの導入方法のまとめ(コンテンツホルダー・一次公開者向け) - digitalnagasakiのブログ

    IIIFの導入の仕方がよくわからない、という声を結構あちこちで聞きます。ブログ記事として断片的に書いてきているのですが、それをいちいち探して読んでいただくのも大変ですので、改めて簡潔に記しておきます。ただし、既存のサーバ環境やサーバ・ネットワーク運用ポリシーによってできることは結構違ってくることがありますので、その点はよくご注意ください。 それから、IIIFの場合、「導入」と言っても、コンテンツホルダーや一次公開者向けの「導入」とは別に、既存の公開IIIFコンテンツを素材とする二次利用公開という観点での「導入」があります。これは今までは「利活用」と呼ばれてきたものだと思いますが、たとえば地図年表上に他所のIIIFコンテンツをマッピングできるシステムの例などをみますと、もはや「導入」と言ってしまってもいいような雰囲気があるように思っております。が、ここでは、あくまでも、一次公開者向けの導入方

    IIIFの導入方法のまとめ(コンテンツホルダー・一次公開者向け) - digitalnagasakiのブログ
    tokg
    tokg 2017/10/30
  • 1