タグ

ブックマーク / digitalnagasaki.hatenablog.com (43)

  • ビッグデータ時代の文学研究に何ができるのか?/Ted Underwood 『遠い地平線』序文「文学の地平線の弧」和訳 - digitalnagasakiのブログ

    3/15(金)、一橋講堂(千代田区一ツ橋)にて、DHの国際シンポジウム「ビッグデータ時代の文学研究と研究基盤」が開催されます。そこで基調講演をしてくださるTed Underwood先生は、ビッグデータ時代の文学研究に正面から取り組む英文学者として活躍しておられ、2019年、その成果として「Distant Horizons: Digital Evidence and Literary Change」をシカゴ大学出版局から刊行されました。このの序文は、大変興味深いものであり、膨大なデジタルテキストをにどのように取り組めばよいのか、そして、それによって、人がただ読むだけではうまく見えてこなかった文学の様々な側面、特に文学史やジャンルがどのようにして見えるようになるのか、ということについて、ラディカルな議論と一つの解決の方向性を提示しておられます。の全体としてはその具体的な方法も示されています

    ビッグデータ時代の文学研究に何ができるのか?/Ted Underwood 『遠い地平線』序文「文学の地平線の弧」和訳 - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2024/02/08
    「大きな歴史的パターンを目に見えるものにした進歩は、コンピュータというよりも、モデリングや解釈に関する新しい考え方と関係がある」
  • NDL古典籍OCRによって漢文仏典研究環境が飛躍的に便利に: - digitalnagasakiのブログ

    表題の通りのことを実現できましたので、とりあえずこちらにてご報告です。 やや説明が難しいのですが、何ができるように/便利になったのかというと、 「SAT大蔵経DBのテキストをクリックするだけでそれに対応する宮内庁宋版一切經の行や東京大学嘉興蔵の行がそれぞれ拡大表示される」機能が追加された、というものです。(最近はシステムを他の人に作っていただくこともありますが、今回は表示システムの部分は全部自分で作っています) SAT大蔵経DBはこちらです。 そして、この位置合わせを行うにあたって、NDL古典籍OCRで生成したテキストデータが非常に役立った、ということなのです。 例として、以下のURLで表示可能な経典を用いてみます。 21dzk.l.u-tokyo.ac.jp 先に具体的な使い方をご説明しますと、今回、下記のところに新たにチェックボックスが2つ追加されました。 たとえば、上記のように「宮内

    NDL古典籍OCRによって漢文仏典研究環境が飛躍的に便利に: - digitalnagasakiのブログ
  • AIの助けを借りて蔵書印を解読/蔵書印ツールコレクションの公開 - digitalnagasakiのブログ

    このたび、一般財団法人人文情報学研究所より、「蔵書印ツールコレクション」が公開されました。 https://seal.dhii.jp/ 構築の経緯など、詳しくは「蔵書印ツールコレクションについて https://seal.dhii.jp/about/」をご覧ください。 このツールコレクションの目玉は、18万字の篆字画像を用いたディープラーニングによる篆字画像検索です。篆書で読めない蔵書印を、1文字でも2文字でも、画像で文字検索することで文字単位での確認を支援するものです。文字が確認できたら、そこから今度は蔵書印データベース検索にジャンプすることで、蔵書印そのものの検索もできるようになっています。すでに蔵書印データベースに登録されているものであれば、そこで同じ蔵書印を見つけることができるかもしれません。この使い方に関しては解説動画もありますので、そちらもご覧になるとよいかと思います。 このツ

    AIの助けを借りて蔵書印を解読/蔵書印ツールコレクションの公開 - digitalnagasakiのブログ
  • DHフェス2023が発表者・参加者募集中です - digitalnagasakiのブログ

    人文学+デジタルな取り組みを気楽に話すオンラインミーティング、DHフェス2023が発表者・参加者募集中です! sites.google.com かっちりした話でなくても、むしろ、研究のアイデアや相談事などの持ち込みを歓迎しているようです。 「デジタルでこういうことをやってみたいけどどうしたらいいのかよくわからない」というようなことでも 持ち込んでいただければ面白い展開があるかもしれません。会場は、バーチャルコミュニケーションツールoViceを用いる予定です。 ぜひご参加ください。 ちなみに、去年は以下のように開催されました。 digitalnagasaki.hatenablog.com

    DHフェス2023が発表者・参加者募集中です - digitalnagasakiのブログ
  • くずし字OCR等の動向を踏まえて、研究者の方々に期待すること - digitalnagasakiのブログ

    いま、日近世研究、とくに文学研究のあたりがすごいことになっています。膨大な国費が投入されて数十万点の日歴史的典籍がデジタル化・公開されてしまっていますが、大半は江戸時代の版のようですね。そして、さらに、そこに書かれたくずし字にOCRをかけたテキストが無料で公開されようとしており、一方で、グーグルが雇用している研究者が、フリーソフトでくずし字OCRソフトやアプリを開発・公開してくれています。さらに、お金があれば、凸版印刷もくずし字のテキスト化をしてくれるそうです。こういった流れを受けて、12月にはイギリスでもThe Digital Turn in Early Modern Japanese Studiesというシンポジウムが開催されるそうです。 実際のところ、そんなこと頼んでないのに…と思っておられる研究者の方々も多いのではないかと思います。が、他の周辺分野からみると、うらやましいと

    くずし字OCR等の動向を踏まえて、研究者の方々に期待すること - digitalnagasakiのブログ
  • 人文学データにおけるジェンダーの記述手法がTEIガイドラインに導入されるようです - digitalnagasakiのブログ

    先週は、イギリスのニューカッスル大学にてTEIカンファレンスが開催されていました。TEI (Text Encoding Initiative)というのは、人文学のためのテキストデータを構築するために1987年から策定され続けている国際的なデファクト標準のガイドラインであり、それを策定する団体のことでもあります。前者をTEIガイドライン、後者をTEI協会(Consortium)と言います。 このTEIガイドラインの詳細については、最近、日語の解説書『人文学のためのテキストデータ構築入門』(文学通信)が出まして、アマゾンのKindleでも読めますので、よかったらぜひご覧ください。お金を出すのは大変だけどなんとかして読みたいという場合は、公開前提のレビューを執筆してもよいのであれば、「『人文学のためのテキストデータ構築入門』刊行記念レビューキャンペーン」から申込んでいただければ無料で読むことも

    人文学データにおけるジェンダーの記述手法がTEIガイドラインに導入されるようです - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2022/10/31
    「女性に生まれ変わったり気持ちまで女性になったりしたことのあるヴァージニア・ウルフの小説『オーランド―』の主人公は以下のように記述できることになった」
  • 京大OCW閉鎖の件に寄せて:これからの可能性だったものの一つ - digitalnagasakiのブログ

    京都大学高等教育研究開発推進センターが9月末に廃止されることに伴い、「京都大学オープンコースウェア(OCW)」が閉鎖されるというニュースに接した。実際のところ、これがその後どうなるのかはわからないが、現在知らされている範囲では、とにかくなくなってしまうようだ。 基的に、Webコンテンツの持続可能性について、私は、「とにかく再利用可能なライセンスをつけておけば存続できる」という点を大切にしているのだが、それは必ずしもうまくいかない面がある。貴重資料の画像で、それにメタデータを付与して一緒に流通させ、ハッシュでデータの改ざん可能性を管理したりすれば、さらに、そもそもIPFSでなんとかすれば、と考えたりしつつ色々なことを試しているのだが、しかし、オープンコースウェアの場合、またちょっと話が変わってくる。オープンコースウェアは基的になまものの教育コンテンツを志向するものであり、それ単体で価値を

    京大OCW閉鎖の件に寄せて:これからの可能性だったものの一つ - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2022/08/09
    “教育コンテンツとしてどこかが裏書きをしてくれることが期待されるものであり、つまり、適宜のアップデートも必要になる”
  • 日本発のプレプリントサーバJxivに論文を載せてみました - digitalnagasakiのブログ

    いわゆる10兆円ファンドの運用主体としてますます注目を浴びる科学技術振興機構(JST)が、最近、プレプリントサーバの運用を開始したそうです。その名もJxiv。すでに海外にいくつか著名なプレプリントサーバがあり、国内でも筑波大学が筑波大学ゲートウェイというプレプリントサービスを含む包括的なサービスを開始していることもあり、どういったところで個性や存在意義を打ち出していくのか、気になるところです。とりあえず「誰でも投稿できる」「日語論文でも大丈夫」「人文系でも大丈夫」というのが特徴になるような印象を持ちました。(間違っていたら申し訳ありません) プレプリントサーバは、サイエンスの崇高な理念を体現する存在であり、オープン性を踏まえた知識循環の基盤となるものと認識していたところであり、また、それゆえに、そのラディカルなオープン性に親和性が高くない分野やワークフローなどにはちょっと縁遠いものかもし

    日本発のプレプリントサーバJxivに論文を載せてみました - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2022/05/12
    「プレプリントサーバと言っても、結局、査読前論文が公開されてしまうのだとしたら、いくつか難しい問題が登場してきそう」
  • 日本学術会議の公開シンポジウムで人文・社会科学のデジタル研究基盤がテーマとなります - digitalnagasakiのブログ

    今度の土曜日、1/22に、日学術会議の公開シンポジウム「総合知創出に向けた人文・社会科学のデジタル研究基盤構築の現在」が開催されます。 日学術会議には「分野別委員会」があり、それぞれの委員会が分科会を設置して特定のテーマについて議論します。多くの分科会は 1つの分野別委員会の下で活動をしますが、今期は、心理学・教育学委員会、言語・文学委員会、哲学委員会、社会学委員会、史学委員会、地域研究委員会、情報学委員会の 7つの委員会が合同で「デジタル時代における新しい人文・社会科学に関する分科会」を設置して、デジタル・ヒューマニティーズやデジタル技術を用いた社会科学の現状と課題についての議論を行っています。その活動の一環として開催されるのが、1/22の公開シンポジウムということになります。 プログラムは以下のようになっており、人文・社会科学、なかでも、これまであまり採り上げられてこなかった質的研

    日本学術会議の公開シンポジウムで人文・社会科学のデジタル研究基盤がテーマとなります - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2022/01/19
    いろいろあって見れなかったやつ。
  • 人文学研究者必読の第六期科学技術・イノベーション基本計画のポイントを確認してみる - digitalnagasakiのブログ

    科学技術法は、しばらく前までは「科学技術(人文科学のみに係るものを除く。以下同じ。)」という 文言で人文学を除外していましたが、令和3年4月、「科学技術・イノベーション基法」に変更されて 施行され、これにともない、人文・社会科学が含まれることになりました。今後は、人文学に関しても政策的な 研究事業のある部分はこれに沿って進められることになるようです。いわば、科学研究一般の一部として 学術政策により強く組み込まれることになるのだろうと思っております。 では、人文学はどういう風に組み込まれたのでしょうか? ここでは、筆者がネットで調べられる範囲で、この基計画にどのように人文学が組み込まれているのかを 関連資料とともにみてみましょう。 内閣府の 第6期科学技術・イノベーション基計画 の頁にこれまでの経緯や、今回の法改正を受けた基計画の文書(PDF)などが掲載されています。 全84頁の

    人文学研究者必読の第六期科学技術・イノベーション基本計画のポイントを確認してみる - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2021/10/06
    永崎さんのよくわかる解説。
  • 翻訳は研究業績にならないの? - digitalnagasakiのブログ

    少し前に、パワポ資料は研究業績にならないのか、という記事を書きましたが、 最近、以下のツィートを拝見しましたので、今度は、翻訳はどうなのか、ということについて少し思うところを書いてみたいと思います。 いつからでしょう、学術の世界で翻訳が研究者の業績としてカウントされなくなってしまったのは。自分の世代で考えると、サイードやフーコーなどの翻訳がなかったら、多くの英米文学が翻訳で読めなかったら、今の自分はあるのかとか真剣に考えてしまう。翻訳文化は学術の基礎研究のはずなのに。— Yoshiyuki Kido (@ykido66) 2021年8月20日 まず、細かいところに突っ込むようですが、しかしこの種の事柄を検討する上で大事なポイントだと思うので 抑えておきたいのが、 「研究者の業績」を「カウント」するということ自体が、少なくともここで問題になりそうな 人文系においては割と最近のことだったのでは

    翻訳は研究業績にならないの? - digitalnagasakiのブログ
  • 研究業績はなぜ論文でなければならないのか?パワポはダメ? - digitalnagasakiのブログ

    久々に、いかにもブログらしいという感じの何の役にも立たない記事を書きます。 研究業績はなぜ論文でなければならないのか? ということは自分としては長年の謎の一つでしたが、では、パワポ資料が研究業績だと言われたらどうするだろうか、と 考えてみることにしました。 パワポ資料、研究業績だと言っても悪くないような気がします。ファイルの形式にこだわって内容を見ないなんてナンセンスです!はい終了! …と一瞬思ってしまいそうですが、しかし、これを研究業績として評価しようと思った場合に少し難しさが生じてくるような 気がしてきました。 パワポ資料は自由です。テキストや矢印や図があちこちに登場して、 それがなんとなく重なったりつながったりしながら何かをわかりやすく 伝えようとしてきます。いらすと屋さんのかわいい絵がさらにそれを助けてくれる こともあります。 では、目の前にある素敵なパワポ資料の内容が研究業績に値

    研究業績はなぜ論文でなければならないのか?パワポはダメ? - digitalnagasakiのブログ
  • 人文系研究者はデジタルに手を出しても評価されない? - digitalnagasakiのブログ

    (2021/07/06 午前、追記あり) 海外ではデジタル・ヒューマニティーズ(DH)が普及しつつあるのに日では…という話は最近よく聞きます。 日でDHについての話題が出ると、人文系のベテラン研究者の方々からは 「しかしデジタルに手を出しても評価されないんだよね…」という話をよく聞きます。 ではそれは 海外ではうまくいっているのかというと、海外でも完璧にうまくいっているわけではなさそうです。 ただ、多くの大学にDHセンターが設置されたり、DHのカリキュラムが提供されるようになったりして、 ポストがかなり増えてきていて、そうすると、そういったところで自分の分野での取り組みが なんらかの形で評価軸を持てるようになれば、そこで自分の分野の若手がポストを確保しやすくなると いった状況は生じるように思います。たとえば、文学や歴史学でデジタルに取り組んでいる人が そういったポストに採用されようと思

    人文系研究者はデジタルに手を出しても評価されない? - digitalnagasakiのブログ
  • 書物のグローバルな歴史における日本の位置付け - digitalnagasakiのブログ

    今夜は慶應義塾ミュージアム・コモンズのシンポジウム「KeMCo国際シンポジウム|景——書物文化がつくりだす連想の風景」を 拝聴して勉強させていただいた。 前大英図書館収書・司書部長のクリスチャン・イエンセン氏、トロント大学の中世英文学教授、アレクサンドラ・ギレスピー氏、オクスフォード大学ボドリアン日研究図書館長のアレッサンドロ・ビアンキ氏という豪華な海外メンバーに加えて、日からも松田隆美氏、佐々木孝浩氏、徳永聡子氏、という豪華メンバーに加えてディスカッションは間友氏が仕切るという、慶應大学の盤石さを感じさせる素晴らしい構成のシンポジウムだった。 ベンヤミンのアウラを媒介としてミュージアムと図書館における価値の在り方の違いを明快に示した冒頭のイエンセン氏の講演は、このシンポジウムのみならず、ミュージアム・コモンズや、さらに、議論の場の形成に課題を抱える日のデジタル・アーカイブにヒン

    書物のグローバルな歴史における日本の位置付け - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2021/06/02
    “独自の大量の書物を有しており、その調査も相当程度も進んでいる…グローバルな書物史を検討する際に、周辺地域の事例として非常に活用しやすい”
  • TEIガイドラインにルビが導入:人文学向け国際デファクト標準に沿った日本語テキストデータの作成が容易になりました - digitalnagasakiのブログ

    人文学向けデジタルテキスト作成の国際デファクト標準、TEIガイドラインでルビが導入されました 2月25日付けで、TEI協会が策定・公開している人文学資料のデジタル構造化の国際デファクト標準である TEI ガイドラインの version 4.2.0がリリースされ、 日語のルビが導入されました(リリースノート)。 これにより、ルビが付された膨大な日語テキスト資料をTEIガイドラインに準拠して構造化することが、これまでとは比べものにならないくらい簡便になりました。このことは、 国際的な人文学向けデジタルテキスト構築の流れの中に、ルビ付の日語テキストデータをそのまま組み込むことができるようになったということでもあります。 注:ルビ以外の文外要素、いわゆる訓点や脚注・欄外注などの色々な要素は基的にTEIガイドラインでは昔から対応可能でした。(詳しくはこちら)さらに言えば、ルビも工夫すれば記

    TEIガイドラインにルビが導入:人文学向け国際デファクト標準に沿った日本語テキストデータの作成が容易になりました - digitalnagasakiのブログ
  • ケンブリッジ大学デジタル図書館の日本資料の書誌情報を視覚化してみる - digitalnagasakiのブログ

    日は、第3回 日宗教文献調査学 合同研究集会という会合でパネルディスカッションの司会をさせていただきました。 司会が自分が言うのもなんですが、大変興味深い議論が行われたようにも思いまして、ご参加いただいたみなさまのおかげで意義のある場になったように思いました。 もし、このパネルディスカッションの場でこういう話になった場合に、ということで少し用意したネタがあったのですが、結局披露することができずに お蔵入りとなってしまったのでこちらで紹介させていただきます。内容は表題の通りです。 ケンブリッジ大学デジタル図書館では、幅広い分野をまたぐデジタル図書館を公開していて、サブジェクト・ライブラリアンが 付与したやや詳細なメタデータがCC BY-NC-NDで公開されています。(欧州の文化機関から公開されているメタデータですがCC0ではない という点も留意していただきたいところです。) このメタデー

    ケンブリッジ大学デジタル図書館の日本資料の書誌情報を視覚化してみる - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2021/02/27
    「日本資料のTEI/XMLデータを一通りダウンロードしたあと、それをPythonでささっと処理してデータを数えて、 それをエクセルに入れてグラフにしたというもの」
  • 「デジタル人文学」以前の日本の人文系デジタルテキスト研究を探訪してみる - digitalnagasakiのブログ

    日、日デジタル・ヒューマニティーズ学会(JADH)の年次国際学術大会JADH2020が終了しました。リアル開催の予定だったものがバーチャルに途中で変更になり、日程も少し後ろに動かして、それでもなんとかきちんと開催でき、それほど人数は多くないながらも意義のある議論が展開され、相互に認識を深められるとても良い学会になったと思いました。開催を引き受けてくださった大阪大学言語文化研究科の田畑智司先生、ホドシチェク・ボル先生には感謝すること至極です。また、キーノートスピーチを引き受けてくださった東国大学のKim Youngmin先生、IIT インドールのNirmala Menon先生、それから、休日を返上して参加してくださった発表者・参加者の方々のおかげで会も盛り上がりました。大変ありがたく思っております。JADHは、国際デジタル・ヒューマニティーズ連合(Alliance of Digital

    「デジタル人文学」以前の日本の人文系デジタルテキスト研究を探訪してみる - digitalnagasakiのブログ
  • デジタルアーカイブ学会賞授賞を機に『日本の文化をデジタル世界に伝える』を改めてご紹介 - digitalnagasakiのブログ

    昨秋、『日文化をデジタル世界に伝える』という著書を刊行した。このブログでは刊行の経緯について触れたことがあり、また、大学院生の方々による紹介記事を掲載したことがあったが、内容について、自分ではあまり触れなかった。このが、ありがたくもデジタルアーカイブ学会の賞をいただくことになり、最近、そのための挨拶文を書くという機会があり、また、少し前に、ありがたいレビューをいただいたこともあり、改めてこのが伝えようとしていることについてちょっと記しておきたい。 書は、端的に言えば、文化資料デジタルアーカイブの構築・運用を扱うものである。そして、技術的な事柄を基礎として、そこから立ち上げってくる種々の課題に ついて解説したものである。近年デジタルアーカイブにおいて中核的なものとなってきているWeb技術は日進月歩だが、同時に、常にその技術的制約によって 提供者・利用者ができることが変わり続けている

    デジタルアーカイブ学会賞授賞を機に『日本の文化をデジタル世界に伝える』を改めてご紹介 - digitalnagasakiのブログ
  • MLAのウチとソト - digitalnagasakiのブログ

    MLA、と言われて、「文系」の人が思いつくものにはおそらく2種類あります。一つは、Museum, Libraries, and Archivesの略であり、博物館・美術館・図書館・文書館等のことを 総称し、そういった文化的なことがらに関わる機関が連携して活動することを志向して使われ始めたものではないかと想像しています。もう一つは、 Modern Language Association の略語であり、Wikipediaでも紹介されていますが、 19世紀からある割と古い学会であり、どちらかと言えば比較文学的な方向性が強いと聞いたことがありますが、いずれにしても、米国の文学系学会の中ではかなり大きなものの一つのようです。 2014年に開催されたものは日語でイベントレポートが読めます。(なんと、今や各方面で有名な北村紗衣先生が訳してくださっています。)参考文献のスタイルで「MLA形式」というの

    MLAのウチとソト - digitalnagasakiのブログ
    egamiday2009
    egamiday2009 2020/07/09
    MALUI。
  • UTDHアンカンファレンスへのお誘い - digitalnagasakiのブログ

    学会・研究会の類がどんどん中止になっていき、一方で、オンラインでの開催も徐々に広がりつつあります。 そのようななかで、東京大学大学院人文社会系研究科人文情報学部門の大向一輝先生を中心に、 UTDHアンカンファレンス、というイベントが、今度の日曜日の午後(2020年4月26日(日)13:30より)にZoomにて開催 されることになりました。主なテーマは、人文情報学(デジタル・ヒューマニティーズ)、デジタルアーカイブ、といった感じに なります。 scrapbox.io ご参加にあたっては、上記のサイトから参加申し込みをする必要があります。 今のところ、以下のようなセッションが予定されているようですが、その後もう少し入れ替えや増減があるかもしれません。 財務記録史料の構造化記述に向けて 文化庁メディア芸術データベース・ベータ版のデザイン 大蔵経データベースの近未来 自然科学記録のデジタルアーカイ

    UTDHアンカンファレンスへのお誘い - digitalnagasakiのブログ