タグ

ブックマーク / iori3.cocolog-nifty.com (3)

  • 国は日本を代表する文学作品(本当は全集まで)を責任をもって電子化して世界に公開せよ 青空文庫など個人が入力した電子化テクストについて - 天漢日乗

    国は日を代表する文学作品(当は全集まで)を責任をもって電子化して世界に公開せよ 青空文庫など個人が入力した電子化テクストについて TLやFacebookで 青空文庫のテクストが「不正確」だ という指摘と、それに対しての反論とが飛び交っている。 で。 普段写や版等から翻字している立場から言うと 他人の翻字は信用するな でおしまい。 更に言えば 他人が電子化してくれたテクストは感謝しつつ使用すべき であって、 正確を期すために、信用すべき底と参照するのは自分の仕事 である。 わたしは87年に初めてパソコン(98互換機のEPSON 286-V STD)を使い始めた時から OCRによる電子化テクスト をその使用目的としていた。残念ながら87年当時は、いまのように個人が気軽に 自炊 できるようなスペックの機器はなく、まだOCR入力は自前の装置ではできなかったが、HAL研のハンディスキャナで

    国は日本を代表する文学作品(本当は全集まで)を責任をもって電子化して世界に公開せよ 青空文庫など個人が入力した電子化テクストについて - 天漢日乗
  • コピーとスキャン - 天漢日乗

    市立図書館から借りてきたをスキャン。 片方は 大日仏教全書 興福寺叢書巻一 で、欲しいのは 僧綱補任巻一 である。僧綱補任は文もさることながら 裏書 というのも収録されていて、文の闕を補って余りある。 もう一つは、専門書で、必要な論文だけスキャンする。訓点が入った漢文が引用されているから、日語OCRにかけると、訓点がゴミになるのよね。 僧綱補任は後処理の方が遙かに面倒なので、日語OCRに掛ける気にならない。割注の入った文章を日語OCRに掛けると、もう厭になるくらい手間が大変になる。薬方程度だったら気にならないけど、割注だけで1行分近くあると、もう手で入力した方が絶対に速い。 しかし、コピーするもスキャンするのも、時間は一緒。画像をプリントアウトしておしまいか、画像を情報として残すかの違いだけだ。 ブラウズする時の便は、また紙の方がある。 スキャン画像も読むのにはいいのだが、画

    コピーとスキャン - 天漢日乗
  • 佐々木俊尚『ブログ論壇の誕生』文春新書→商業出版や商用サイトが個人blogを引用しても連絡してこない件→追記あり - 天漢日乗

    先日の『諸君!』の鼎談のときに 『諸君!』の連載を纏めたものを文春新書で出す と佐々木俊尚さんご人から伺っていたのだが、発売されたので、珍しくbk1から買ってみた。(いつもはアマゾンか楽天) 内容は、ご人の仰るとおり 『諸君!』の「ネット論壇時評」のリライトが中心 だ。ただ、時系列に沿って並べてあるのではなく、章立てには工夫が見られる。 なかなか面白かった。 で、社会学なんかでネットを対象にしている研究で、佐々木さんより調べがたりなくて、更に何も知らない上のおじさん・おばさんをダマしている論文はあるな、と感じた。学生や院生に舐められてますな、文系大学人は。つか、今年のネット関連卒論・修論には、佐々木さんの著書の何冊かを下敷きにしてリライトした論文が多数出そうな悪寒。 問題は、「あとがき」にあるように 書ではさまざまなブログから、さまざまな文章を引用させていただいた。ひとつひとつのブロ

    佐々木俊尚『ブログ論壇の誕生』文春新書→商業出版や商用サイトが個人blogを引用しても連絡してこない件→追記あり - 天漢日乗
    copyright
    copyright 2008/09/24
    ユリイカにブログの紹介を書いたときには、ブログ主に連絡しなかったよ。
  • 1