タグ

2010年4月15日のブックマーク (4件)

  • 「読み」がメタデータに振れない!! - 村田真のXMLブログ

    人で唯一W3CのXMLワーキンググループに参加しXMLの標準化プロセスに携わったXMLの生みの親、村田真さんのブログです。 「読み」がメタデータに振れない!! 今日になって驚愕しました。Atom feed、ODF、OOXML、EPUBのいずれに ついても、「読み」をメタデータ(例えば著者名)にどう振ったらいいか分 かりません。 これらの仕様書には、「読み」のことはなにも書いてありません。いずれも ダブリンコアを使っているんですが、ダブリンコア体では「読み」のこと はなんにも規定されていません。その一部を単に採用したAtom feed, ODF, OOXML, EPUBに「読み」のことが書かれていないのは当然かも知れません。 方法がないわけではありません。国会図書館のダブリンコアメタデータ記述 要素(DC-NDL)というものがありますが、これではdcndl:titleTranscrip

    tinsep19
    tinsep19 2010/04/15
    国会図書館のダブリンコアメタデータ記述 要素(DC-NDL)というものがありますが、これではdcndl:titleTranscription やdcndl:publisherTranscriptionなどの要素を導入しています。> 国会図書館にフィードバックしろよというのは筋違いか
  • “変なソフト”として進化する人気Android日本語入力「Simeji」

    語圏のAndroid搭載スマートフォン利用者にとって、最も知名度が高いアプリケーションの一つが日本語入力ソフトSimejiである(写真1、写真2、写真3)。日で発売されるAndroid搭載スマートフォンには日本語入力ソフトがあらかじめインストールされているが、それにもかかわらず“草の根”のソフトであるSimejiの人気は高い。Android Marketの表示によれば、記事執筆時点で5万~20万ダウンロードという実績を持つ。

    “変なソフト”として進化する人気Android日本語入力「Simeji」
    tinsep19
    tinsep19 2010/04/15
    。Simejiのキーボードに常に表示されているマッシュルームキーをタップすると、マッシュルームに対応したアプリの一覧が表示される
  • Variable Byte Code と UTF-8、またはUTF-24が存在しないわけ : 404 Blog Not Found

    2009年08月05日00:30 カテゴリLightweight Languages Variable Byte Code と UTF-8、またはUTF-24が存在しないわけ 実は、これに非常に良く似た符号化を、我々は日々目にしています。 γ符号、δ符号、ゴロム符号による圧縮効果 - naoyaのはてなダイアリー 通常の整数は 32 ビットは 4 バイトの固定長によるバイナリ符号ですが、小さな数字がたくさん出現し、大きな数字はほとんど出現しないという確率分布のもとでは無駄なビットが目立ちます。 UTF-8です。 UTF-8は、0x0から0x10FFFFまでの整数を、以下のようにしてバイト列に変換します。 Range/Offset0123 0x00-0x7F0xxxxxxx 0x80-0x3FF110xxxxx10xxxxxx 0x400-0xFFFF1110xxxx10xxxxxx10xx

    Variable Byte Code と UTF-8、またはUTF-24が存在しないわけ : 404 Blog Not Found
    tinsep19
    tinsep19 2010/04/15
    そうやって考えると、UTF-8というのは実によく出来ています。どのbyteが文字の先頭で、そして先頭byteを見れば「その文字にあと何byte必要なのか」がたちどころにわかるようにもなっています。
  • http://www.dpj.or.jp/seikatsu_futanzo.html

    tinsep19
    tinsep19 2010/04/15
    要するにわかりやすい政治っていうのは、伝えたいことをマンガにして、伝えたくないことを細かい文字にすることだな。あとこれから企業、政党のお抱えマンガ家って職業ができるんだなきっと。