タグ

ブックマーク / d.hatena.ne.jp/fuzzy2 (26)

  • データの長期保存 - fuzzy Weblog@hatena (更新終了)

    デジタルデータは概ね10年ごとに消滅してしまう。 http://www.asahi.com/tech/sj/long_n/02.html 2008-09-04 ネット上のデジタルデータでもったいない大きな話としては、およそ10年以上前のパソコン通信(BBS)のデータが概ね失われている問題もあります。これは技術的な問題というより事業者側の問題。 さて、個人的には現在600GBのデータをお預かりしているのですが、この長期保存は大きな技術的な課題の一つです。 おおげさっぱに言って、「デジタルデータが数千年にもわたって存続する」には「3つの障害」があるわけ。 データが書き込まれたメディアそのものに不具合が発生する メディアそのもの劣化 物理的、化学的、ないし磁気的にビット情報が消滅 前者については、壊れる前に定期的にハードディスク(HDD)を交換することで対応しています。通常12ヶ月程度で次のHD

  • オンライン情報の学術利用―文献探索入門 読了 - fuzzy Weblog@hatena (更新終了)

  • はじめての言語学 読了 - fuzzy Weblog@hatena (更新終了)

    『はじめての言語学』黒田龍之助著を読み終わりました。 自然言語に関する学問の入門書。自然言語は人工言語(正確にはコンピュータ言語)と比べて全然詳しくない。三上さんの専門の基礎の一つかしら? とふと頭をよぎったけど、当たっているかさっぱり自信がない。 コンピュータ言語の多くは、最初に構文が決定される。そして、多くの場合はBNF(バッカス・ナウア記法)で定義される。それに対して言語学では、文を語に分け、語を音に分ける。これを二重分節性と呼んでいるらしい。 しかしたとえば、「X語では語彙が少ないから宇宙工学の話は理解できない」ということはない。どんな言語でも、多少回りくどいかもしれないが、ことばを尽くせばどんな説明でも必ずできる。ことばは目で見たもの、自分が経験したものだけを表わすのではない。だったら鬼や悪魔の話はできないし、SFというジャンルはなくなってしまう。 人間の言語というのは、どの言語

  • 急に売れ始めるにはワケがある ネットワーク理論が明らかにする口コミの法則 読了 - fuzzy Weblog@hatena (更新終了)

    『急に売れ始めるにはワケがある ネットワーク理論が明らかにする口コミの法則』マルコム・グラッドウェル著、高橋啓訳を読み終わりました。 このは、ティッピング・ポイント(tipping point)を3つの原則から解き明かしています。 【ティッピング・ポイント】 THE TIPPING POINT あるアイディアや流行もしくは社会的行動が、敷居を越えて一気に流れ出し、野火のように広がる劇的瞬間のこと。 (p.3) この三つの特徴のうち、第三の特徴――すなわち、感染の勢いはある劇的な瞬間に上昇したり下降したりすることがありうるという考え――がもっとも重要である。(略) なんらかの感染現象において、すべてが一気に変化する劇的な瞬間を、書ではティッピング・ポイントと呼んでいる。 (p.20) そのティッピング・ポイントには、「少数者の法則」「粘りの要素」「背景の力」の3つの原則が関わっているとの

    急に売れ始めるにはワケがある ネットワーク理論が明らかにする口コミの法則 読了 - fuzzy Weblog@hatena (更新終了)
  • 作家と編集者の違い - fuzzy Weblog@hatena (更新終了)

    http://d.hatena.ne.jp/REV/20080615/p4 経由 このように、両者(作家と編集者)を比較する良い機会だった。そして、「さすがに作家だな」と再認識した。僕自身、会って話すよりも、メールでやり取りする方が、端的に意志が伝えられるし、誤解が少ない、と考えているクチである。だから、相性の問題だろうか(つまり、「さすが作家どうし」か)。また、ちょっとしたトラブルがあるごとに、編集者が飛んでくる、という経験が過去に10回くらいあるのだけれど、ようやくその理由がわかった。 no title プログラマーはコンピューター向けの高い言語化能力が必要。コンピューターは、コードでしか受け付けないから。 スペシャリストはレポート(論文)用の高い言語化能力が必要。スペシャリスト同士は、レポート(論文)を媒介とするコミュニケーションを多用するから。 ↑どちらも、直接人間を介在しない点が

  • ポータブルブック(仮称) 評価版 - fuzzy Weblog@hatena (更新終了)

  • 素晴らしい洋書を見つけたので勝手に翻訳してみたのですが、これを出版する方法はありませんか? - fuzzy Weblog@hatena (更新終了)

    1. 商業出版物(書籍)として出版する場合 著者あるいは有望な日の出版社に連絡し、翻訳の機会がないか打診する。 a. 既に出版作業が進んでいる→作業に参加することを希望するか、出版を待つ。 b. 出版作業はまだ b1. 日の出版社が乗り気→話を進める。 b2. 日の出版社が乗り気でない→他の出版社に打診するか、あきらめる。 2. 自費出版物として出版する場合 著者に連絡して、日語版の発行の許可を求める。 a. 著者よりOKがでた→話を進める。 b. 著者より条件がでた→条件をすりあわせる。 c. 著者よりNGがでた/返事が来ない→あきらめる。 3. 限定者に配布する場合 講演または勉強会のような形態で、希望者を募り、資料として配布する。 おそらく原著(新刊)の購入が望ましい。 日語版のコピーにかかる費用程度の徴収は問題ない。 収支について 1の場合は、原則として翻訳者が出版にかか

  • 最高の報酬 お金よりも大切なもの 働く人の名言集 読了 - fuzzy Weblog@hatena (更新終了)

  • メモ 私塾のすすめ - fuzzy Weblog@hatena (更新終了)

    http://d.hatena.ne.jp/umedamochio/20080422/p1 近所で購入しようと思ってAmazonで注文していなかったのですが、都合により書店に1回しか寄れてなくて、しかもそこの店頭では見つけられなかったので、先ほどAmazonで注文したところです。 というわけで『私塾のすすめ』を読んでいない段階ですが、従来の梅田氏の主張やブログから想像するに、「同じテーマで一緒に勉強できる人を得ることができる環境」がキーではないかと思います。 勉強という点では自分は現在も泥の中を歩いているような状況ですが、三上さんのブログ(id:elmikamino)を参考に日語・組版関連の書籍を買って読んだり(Amazon他の書籍代が月に10万円を超えた。これは新記録!)、坂東さん(id:keitabando)や相沢さん(id:maple_magician)と近いテーマの書籍や情報を調

  • 東京大学コレクションIII 歴史の文字―記載・活字・活版 読了 - fuzzy Weblog@hatena (更新終了)

    『東京大学コレクションIII 歴史の文字―記載・活字・活版』西野嘉章編を読み終わりました。 印刷所の話では、工場にある鉛活字だけで重さが優に百トンを超えるという。これには、実のところ度肝を抜かれた。原材料は鉛と錫とアンチモンの合金。しかも日語文を構成する漢字の数、字の種類やポイント級数などを考えたら、これも当然だろう。(略) こうした事情もあり、展には、いくつかの歴史的な文化財と併せて、三百万を超える鉛活字が展示品として用意されている。百万単位の数を論うには訳がある。活字による印行には、桁外れの膨大なパーツの準備と、それを組み立てる奇跡的な職人技が必要である。三百頁程の標準的なを活版で印刷するのにおよそ十万の活字と込物が使われ、その重量は一トンにも達する。われわれが何気なく手にしてきた活版印刷は、そうした圧倒的な重さを背後に持っているのである。 原稿用紙数百枚が、活版印刷で

  • Re: 「昔は旧字体で書いていた」なんてウソだ! - fuzzy Weblog@hatena (更新終了)

    1949年、当用漢字字体表が発表され新字体が採用された。 これによってそれまで使われていた字体は、旧字体とか旧漢字と呼ばれることになった。 ただしこれは印刷についてのことである。 当用漢字字体表の発表前には、印刷字体と手書き字体は違うものだったのである。 「昔は旧字体で書いていた」なんてウソだ!: ほぼ文字についてだけのブログ(tonan’s blog改) コメント欄も含めて興味深い展開となっています。 この種の議論では、用語の定義をきちんと詰めて合意しておかないと話が噛み合わないものなので、そのためにも根拠となる文書を共有できる形にすることが重要です。個別的・特殊的な事例から一般的・普遍的な規則であるとする主張はいわゆる帰納法としかみなされないことがあるので、十分に裏づけとなりうる情報をオープンにしておく必要性が高いです。このようなときにMyOpenArchiveは活用できるのではないか

  • 異体字の世界―旧字・俗字・略字の漢字百科 読了 - fuzzy Weblog@hatena (更新終了)

    『異体字の世界―旧字・俗字・略字の漢字百科』小池和夫著を読み終わりました。 「正字」とは、「公式に定められて、重要な文書ではその字を使うことになっている字」ということです。(略)そして現代の日では常用漢字が正式な文字、正字です。 しかし、実は「正字」にはもう一つ裏の意味があるようです。それは「字源的に正しい文字」、つまり、「その文字の成り立ちをもっとも正確に表している文字」という含みがあるのです。(pp.28-30) 個人的には、前者を正しい用法として認め、明治から戦前の民間での(通用的な)表記法を「正字・正かな」と呼ぶ用法は認めないこととします。(法令上の定めである「正字」ではないから) 矛盾はここから生まれました。もとはと言えば、二十世紀末の漢字政策がトロイカ状態になっていたことが原因です。『常用漢字表』は文部省・国語審議会、『人名用漢字別表』は法務省、印刷文字は通産省・日工業規格

    異体字の世界―旧字・俗字・略字の漢字百科 読了 - fuzzy Weblog@hatena (更新終了)
  • 文庫本のフォーマット - fuzzy Weblog@hatena (更新終了)

  • 日本語のデザイン 読了 - fuzzy Weblog@hatena (更新終了)

    『日語のデザイン』永原康史著を読み終わりました。 奈良時代のはじめには漢語と倭語から独自の書き言葉がつくられ、新しい日語が生成しつつあった。漢字音で読む「漢語」、漢語に和語をあてて読む「字訓」、固有名詞などに漢字の音をふった「あて字」ができ、さらに、一字一音のあて字である「音仮名」や「訓仮名」も生まれつつあった。これらをすべて漢字で書くのは、どう考えても、むずかしい。そこで、書くためのルールが必要になるのだが、最初にそれを定めたのが『古事記』の筆者(撰録者)、太安万侶(おおのやすまろ)である。古事記の序文にその成立についての記載がある。(p.22) 日語は、漢語と倭語が混ざりながら変化していった。 安万侶は、上古の言葉(和語)はとても素朴で、文(漢文)にすることはむずかしいとし、記述のルールを以下のようにあげている。 一句の中に音と訓を併用する。これは、訓をもとに書けば、内容を十全に

    日本語のデザイン 読了 - fuzzy Weblog@hatena (更新終了)
  • 組版/タイポグラフィの廻廊 読了 - fuzzy Weblog@hatena (更新終了)

    『組版/タイポグラフィの廻廊』府川充男・小池和夫・小宮山博史・日下潤一・前田年昭・大熊肇著を読み終わりました。 日語にまつわる種々の問題について、一連の書籍の中で一番きれいにまとまっているように見えます。 字体を見る眼 小池 国語政策の方では漢字が文部省(現、文科省)、法務省、通産省(経産省)の縦割り三部省にバラバラに分れていて、常用漢字は文部省の管轄、人名用漢字は法務省の管轄、その法務省は文部省の顔色を伺いながら人名用漢字を増やすときには新字体にしてくる。一方、通産省傘下のJIS(日工業規格)は文部省のなかの国語審議会での「負け組」がこっちを取るという状態だった。 そのような実態だったとは。いやはや、これはひどい。 また、いままで法務省の存在を失念していました。法務省も、字体の問題では影響が見逃せない存在だったようです。 仮名と書体を見る眼 小宮山 文字の形でいえば、良い仮名書体とい

    組版/タイポグラフィの廻廊 読了 - fuzzy Weblog@hatena (更新終了)
  • 人間この信じやすきもの―迷信・誤信はどうして生まれるか 読了 - fuzzy Weblog@hatena (更新終了)

    『人間この信じやすきもの―迷信・誤信はどうして生まれるか』T・ギロビッチ著、守一雄・守秀子訳を読み終わりました。 具体的な実験や分析の詳細データは載っていませんが、きちんと参考文献があげられているのでそちらを見ることで内容を検証できそうです。 内容のポイントは、以下の目次の一部にまとめることができます。 第I部 誤信の認知的要因 何もないところに何かを見る――ランダムデータの誤解釈 わずかなことからすべてを決める――不完全で偏りのあるデータの誤解釈 思い込みでものごとを見る――あいまいで一貫性のないデータのゆがんだ解釈 第II部 誤信の動機的要因と社会的要因 欲しいものが見えてしまう――動機によってゆがめられる信念 噂を信じる――人づての情報のもつゆがみ みんなも賛成してくれている?――過大視されやすい社会的承認 ただしい認知を行うためには、上記のような問題を取り除く作業が必要ということで

    人間この信じやすきもの―迷信・誤信はどうして生まれるか 読了 - fuzzy Weblog@hatena (更新終了)
  • メモ 世代間のローマ字入力の許容度の違いについて - fuzzy Weblog@hatena (更新終了)

    http://d.hatena.ne.jp/elmikamino/20080412/1207977449 経由 ローマ字化政策論議 (略) 学校でのローマ字教育は、1947年から小学4年生以上に行われていたが、「ローマ字のつづり方」の告示を受けて、1955年度から学校教育の場で訓令式ローマ字を用いるようになった。1958年告示の「小・中学校学習指導要領国語科編」では、ローマ字学習は40時間行うこととされたが、1968年告示の「小学校学習指導要領」では、ローマ字学習が縮小されることとなった。 国語審議会 - Wikipedia語ワープロ専用機(当時)のコンシューマ市場での購入者の反応には、ローマ字入力に抵抗がない層と抵抗が強い層がありました。単純に小・中学校でのローマ字学習の有無かと思っていましたが、実際には世代によってローマ字学習の量に違いがあったようです。なお、その他に学校での(ロ

  • 真性活字中毒者読本 読了 - fuzzy Weblog@hatena (更新終了)

    「真性活字中毒者読」小宮山博史、府川充男、小池和夫著を読み終わりました。 「日語組版の歴史」 、。・段落行頭字下げの発生と展開の経緯。 「古書温故知新」 小宮山 一つにはやっぱり、例えば仮名にしろ、僕らでは書けないというのがあるじゃない。つまり、筆をよく使っていた時代の人と、そうじゃない人の差というのはものすごく大きいと思うんだよ。だからいくら新しいものを作っても、なんとなく機械的で面白くないというものが出てくるじゃない。 ... 府川 仮名が書けなくなってるだけじゃなくて、ある種の漢字も書けなくなってる。明治八年九月に弘道軒から発売された清朝活字、これはものすごく強い線を持っている楷書で、そういう線というのは、やっぱり上野の山で戦さをやった世代じゃないと書けないということを、佐藤敬之輔さんが言っておられる。 「タイプフェイスとディジタル・フォント」 府川 後期の写植世代あるいは今のデ

    真性活字中毒者読本 読了 - fuzzy Weblog@hatena (更新終了)
  • 本づくりの常識・非常識 第2版 読了 - fuzzy Weblog@hatena (更新終了)

    づくりの常識・非常識 第2版」野村保惠著を読み終わりました。 とても実用的です。お薦めの一冊です。 活字の時代のノウハウをベースにDTP制作をきちんとカバーしている。 DTP世代から編集・組版を始めた作業者の作業レベルの低さを厳しく指摘している。 知っている範囲で少々フォローしてみると、 活字時代はベタ打ち主体だったのではないかと思うが、写植時代になって雑誌などで両端揃え(文字送りや文字形状の調整)が多用される傾向になった。 活字→写植の切り替え時にもやり方の変更に伴い多少問題はあったが、現場には活字経験がある人が多かったため大きな破綻を起こさなかったのではないか? 手書き→日語ワープロ専用機の切り替えの際に実は大きな問題が起こっている。日語ワープロ専用機は活字の組版ルールを無視した独自仕様を始めた。しかも各社が別々の仕様で。この際、活字のルールの多くが継承されなかった。*1 日

    本づくりの常識・非常識 第2版 読了 - fuzzy Weblog@hatena (更新終了)
  • 印刷史/タイポグラフィの視軸 読了 - fuzzy Weblog@hatena (更新終了)

    「印刷史/タイポグラフィの視軸―府川充男電子聚珍版」府川充男著を読み終わりました。 整版+木活字版=木版、様々な活字版の総称=活字版、近代的な鋳造活字=活版 匡廓、単辺、双辺 無界、有界 新聞紙面の変遷 築地体のサンプル 日語ワープロにおける罫線について再整理。 面のまわりを罫線で囲む「匡廓」と呼ぶスタイルと、一行毎に線で区切る「有界」と呼ぶスタイルが江戸時代に成立し普及していたことを府川氏の著作で再認識しました。 日語ワープロの「罫線」機能の目的の一つは「匡廓」を表現することで、もう一つ「有界」を表現するために設計され使われていました。なお、「罫線」の仕様は、主に全角の罫線文字で実現する文字方式と、行間や文字間・文字上に実現する方式に分かれていました。中期頃には両方を実現する機種もありました。なお、文字レイヤーとは別に図形レイヤーを重ねて実現する「図形」機能などと呼ばれる機能もあり

    印刷史/タイポグラフィの視軸 読了 - fuzzy Weblog@hatena (更新終了)