ブックマーク / digitalnagasaki.hatenablog.com (3)

  • デジタルデータの長期保存:iPRES2022 基調講演の日本語訳が公開されました - digitalnagasakiのブログ

    デジタルデータはなくなってしまいやすい…という話を時々耳にします。実のところ、紙媒体と同じくらいの手間をかけてよいのであればデジタルデータの持続可能性は十分に高いと思うのですが、そうだとしても、よりよくきちんと長期保存するためには何らかのルールを作っておいた方が安全です。というのは、なくならないけど読めなくなった、とか、読めるけど誰がいつ作ったものかはよくわからない、膨大過ぎてもう何がなんだかわからない…等々、保存しておくだけでは済まない落とし穴が色々あるからです。これも紙媒体と共通する事項が多いので、紙媒体でどうしてきたかということを確認しながら考えるのはとても重要なのですが、やはりデジタルに固有の課題もありますので、紙媒体での事情を踏まえつつデジタル媒体の特性もきちんと押さえた保存のための手続きのようなものがあるとありがたいところです。 そのような課題については、すでにOAIS参照モデ

    デジタルデータの長期保存:iPRES2022 基調講演の日本語訳が公開されました - digitalnagasakiのブログ
    toshikish
    toshikish 2023/04/10
  • くずし字OCR等の動向を踏まえて、研究者の方々に期待すること - digitalnagasakiのブログ

    いま、日近世研究、とくに文学研究のあたりがすごいことになっています。膨大な国費が投入されて数十万点の日歴史的典籍がデジタル化・公開されてしまっていますが、大半は江戸時代の版のようですね。そして、さらに、そこに書かれたくずし字にOCRをかけたテキストが無料で公開されようとしており、一方で、グーグルが雇用している研究者が、フリーソフトでくずし字OCRソフトやアプリを開発・公開してくれています。さらに、お金があれば、凸版印刷もくずし字のテキスト化をしてくれるそうです。こういった流れを受けて、12月にはイギリスでもThe Digital Turn in Early Modern Japanese Studiesというシンポジウムが開催されるそうです。 実際のところ、そんなこと頼んでないのに…と思っておられる研究者の方々も多いのではないかと思います。が、他の周辺分野からみると、うらやましいと

    くずし字OCR等の動向を踏まえて、研究者の方々に期待すること - digitalnagasakiのブログ
    toshikish
    toshikish 2022/10/28
  • 40代後半人文系で未だにWeb開発をしている理由 - digitalnagasakiのブログ

    もう50歳がすぐそこにきていますが、未だにWebシステムの開発をしています。開発は若手や企業に任せて、自分は開発資金をとったり発注をしたりする側に まわるべきだ、ということもよく言われます。確かにそのとおりです。 ただ、現状のWeb技術のなかで「自分(達)」は何を求めているのか、それを明確にできないと依頼も発注もうまくできないのですが、 それを明確にするには、現在のWeb技術で何をどこまでできるのか、どこまでやるのにコストはどれくらいかかるのか、ということを 把握しておかないとうまくいきません。そもそも我々(この場合人文学者)は、どういうことをしたいのか、どういうものがほしいのか、 ということを、開発する人に正確に伝えるための言葉を、おそらくまだ持っていません。私自身も、そうです。そうすると、 作ってほしいものを無駄なコストをあまりかけずに作ってもらうということは非常に難しい、というか、成

    40代後半人文系で未だにWeb開発をしている理由 - digitalnagasakiのブログ
    toshikish
    toshikish 2020/06/19
  • 1