タグ

2007年5月6日のブックマーク (23件)

  • シフトJISを残すべきか? : 404 Blog Not Found

    2007年03月10日23:30 カテゴリCode シフトJISを残すべきか? Matzさん経由で知ったのだが、これはひどい。 シフトJISを捨てられるか?:ITpro では,今までのデファクトだったシフトJISはどうだろうか。シフトJISを使うと,(英文混じりの)日語を表現する場合,そのデータ長はUTF-8/16/32に比べて短くなる。コンピュータを取り巻く通信環境は高速になり,ストレージは大容量化してきたとはいえ,データ長は短いに越したことはない。確かに、シフトJISで表現できるテキストをUTF-8で表現すると、最高で1.5倍になる(ただしここで言うシフトJISは、Shift_JISX0213は含まない)。しかし、テキストデータというのは圧縮率が高い。 未圧縮gzipbzip2 シフトJIS4,6822,2542,225 UTF-86,7672,5262,325 UTF-8/SJIS

    シフトJISを残すべきか? : 404 Blog Not Found
    as365n2
    as365n2 2007/05/06
    「Unicodeは理論的にも政治的にもベストではない。しかし実装しているものの中ではベストである」
  • Unicodeは「使える」から「知らずに使う」フェーズへ | 日経 xTECH(クロステック)

    Windowsにおいて「Unicode」は,長らく「使える」けれども「あまり使われない」存在だった。その状況が「Windows Vista」と「the 2007 Microsoft Office」で変わろうとしている。この2製品に付属する「Microsoft IME」で,「WindowsではUnicodeでしか扱えない文字」が,変換候補として頻出するようになったからだ。Unicodeはいよいよ,一般ユーザーが「知らずに使う」存在になるだろう。 マイクロソフトがUnicodeに対応したのは,「Windows 98」と「Windows NT 4.0」からだ。このとき,「JIS X 0212」の「補助漢字」も,エンコーディングにUnicodeを使えばWindowsで利用できるようになった。同時に,JIS X 0212の補助漢字などを使った単語が,Windows OSやMicrosoft Offi

    Unicodeは「使える」から「知らずに使う」フェーズへ | 日経 xTECH(クロステック)
    as365n2
    as365n2 2007/05/06
    再読要。
  • Encode - 規格のバグまでは直せません : 404 Blog Not Found

    2006年05月10日11:00 カテゴリLightweight LanguagesLogos Encode - 規格のバグまでは直せません それが規格だからです。 b:note: Encodeのナゾ 最近会う機会が無いので、トラックバックします。 $moji = "~"; Encode::from_to($moji, "euc-jp", "utf8"); print $moji; で出てきた文字をWindowsのメモ帳とか秀丸でみると、~の波形が反対になった文字になってしまいます。 ここでいう「~」はU+FF5E、Fullwidth Tildeのことです。 その答えは、「Unicode Consortiumが用意したJISX0212とUnicodeの変換表がそうだったから」ということになります。Encodeのせいではないのです。詳しくは、 Japanese <-> Unicode Map

    Encode - 規格のバグまでは直せません : 404 Blog Not Found
    as365n2
    as365n2 2007/05/06
    Fullwidth Tildeの変換で「波」の形が左右逆になるのは…。
  • yasuokaの日記: WAVE DASH問題縁起

    Encode - 規格のバグまでは直せませんにコメントしながら思ったのだが、JIS X 0208の1区33点「波ダッシュ」をUnicodeに変換する際、U+FF5EのFULLWIDTH TILDEに変換するのは明らかに間違いだ。この件に関して、私が知る限りのことを、ここに記しておこうと思う。 平成5年度のUCS調査研究委員会WG1において問題となったものの一つが、既存のJISの文字コードとISO/IEC 10646との対応をどうするかだった。JIS X 0208-1990の1区33点「波ダッシュ」に対しては、U+223C、U+223D、U+223E、U+223F、U+301Cが候補となったが、結局U+301Cと対応させることとなった。U+301Cの名前がWAVE DASHだったからである。ただし、ISO/IEC 10646-1:1993のU+301Cの例示字形は、JIS X 0208の「波

  • ひとことあそび

    結城浩です。 「ひとことあそび」は気軽に「ひとこと」を書き込むサイトです。 はてな認証APIとライブドア認証APIを使っているので、 「はてな」または「ライブドア」のユーザならすぐに使えます。 独自のユーザ管理は行っていません。 「ひとことあそび」は、2007年8月号の日経ソフトウエア誌の記事用に作られました。 Copyright (C) Hiroshi Yuki.

  • 波ダッシュ Unicodeに関連する問題 - Wikipedia

    波ダッシュ(なみダッシュ、wave dash[注釈 1])とは、日語表記における約物のひとつで、波線「」(はせん、なみせん)を指している。ダッシュ記号(—)の波形であることからそう呼ばれる[注釈 2]。 日語における用法の多くはダッシュ記号としての用法と長音符としての用法であり、中国語でも長音符などとして使われることがある。 Windows XP等における日語環境下では、表示字形が「」ではなく、波形の反転した「」に変わってしまう問題が発生していた[注釈 3]。これに付随して、波ダッシュの代用として音声記号等として用いられる全角チルダが不適切に使われることがあるため、混乱の元となっている[1][注釈 4]。 波ダッシュは、範囲を表すために用いられる[注釈 5]。 場所に対して: 東京〜大阪 時間に対して: 5時〜6時(もしくは5〜6時) 数量に対して: 100人〜150人(もしくは10

  • はてなリング - はてなブックマーカー

    はてなブックマーカー ダイアリーで登録されているユーザーはこのリングから削除されます。自分のブックマーク(http://b.hatena.ne.jp/自分のid)で登録しなおしてください。 このリングに参加する

  • Twitter detects URL incorrectly :-( - Vox

    Twitter をしばらく利用していて思ったのは,URL の扱いがナニであるということだ.Twitter は,文字列中の URL らしき文字列を自動的にリンクしてくれるのだが,どうも具合が悪い. 典型的なのが "(http://www.yahoo.co.jp)" という,URL を丸括弧で囲んだもので,Twitter 上では "http://www.yahoo.co.jp" がリンクとして扱われるのだが,丸括弧 "(", ")" は URL の一部として許されている文字なので,来は閉じ括弧を含めた "http://www.yahoo.co.jp)" がリンクとして扱われるべきなのだが,よく見られる「発言内容 (補足 URL)」という形式は日語 (?) としては自然で,かつ Twitter が書き手の意図通りにリンクしてしまうのでかなり氾濫している. また,Google Maps の

    as365n2
    as365n2 2007/05/06
  • Unicode CJK互換漢字 F900~FAFF - CyberLibrarian

    範囲:F900~FAFF UnicodeのCJK互換漢字(The Unicode Standard CJK Compatibility Ideographs)を十六進数の数値文字参照で記述した表です。 Pronunciation variants from KS X 1001:1998(KS X 1001:1998(韓国)における発音重複に基づくもの) Unicode 表示 名称 日 韓国 備考 F900

  • http://www.asahi-net.or.jp/~AX2S-KMTN/character.html

  • Windowsの機種依存文字

    Windowsでは、JIS基漢字(JIS X 0208)コードの保留領域である09区〜15区および85区〜94区の一部、ならびに、JIS漢字の範囲外である95区〜114区の一部に、機種依存文字を配置しています。これらの文字は、このままインターネットで使用してはいけませんが、ユニコードに含まれていれば、文字参照を用いて記述できます。 NEC機種依存文字 PC-9800シリーズなど、NECのパソコンが日で主流だったころに独自に定義されていた文字が13区に割り当てられています。 Windows以外のコンピュータをお使いの方は、画像ファイルでご覧ください。 区点 JIS SJIS +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 13区 2D20 873F

  • Macintoshの機種依存文字(画像)

    CyberLibrarian : tips on computer for librarians, 1998-

  • シフトJISの拡張文字

    JISコードの区点では、9~15区と85~94区を未定義とされてゐる。然し、シフトJISでは、13区と89~92区と115~119区の部分に対し独自に漢字などの文字の割当てを行つてゐる。 此処では、この件についてunicode(utf-8)と絡めて説明し、併せて正漢字の使用についての留意点を纏めておきたい。 論 「拡張文字」の一覧表 13区(0x8740~0x879E) ①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ・㍉㌔㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻㎜㎝㎞㎎㎏㏄㎡・・・・・・・・㍻〝〟№㏍℡㊤㊥㊦㊧㊨㈱㈲㈹㍾㍽㍼≒≡∫∮∑√⊥∠∟⊿∵∩∪・・ 89区(0xED40~0xED9E) 纊褜鍈銈蓜俉炻昱棈鋹曻彅丨仡仼伀伃伹佖侒侊侚侔俍偀倢俿倞偆偰偂傔僴僘兊兤冝冾凬刕劜劦勀勛匀匇匤卲厓厲叝﨎咜咊咩哿喆坙坥垬埈埇﨏塚增墲夋奓奛奝奣妤妺孖寀甯寘寬尞岦岺峵崧嵓﨑嵂嵭嶸嶹巐弡弴彧德 90区

    as365n2
    as365n2 2007/05/06
    「IBM拡張文字」と「NEC選定IBM拡張文字」、unicodeの「CJK統合漢字」と「CJK互換漢字」
  • 賽の河原とは 一般の人気・最新記事を集めました - はてな

    死んだ子供が行く所といわれる冥途の三途の川の河原。ここで子供は父母の供養のために小石を積み上げて塔を作ろうとするが、絶えず鬼にくずされる。そこへ地蔵菩薩が現れて子供を救うと言われている。 転じて無駄な努力のこと。 このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

    賽の河原とは 一般の人気・最新記事を集めました - はてな
  • 光武帝 - Wikipedia

    光武帝 王莽が禅譲により新朝を開くと、周代の政治を理想として現実を無視した政策を実施したため、民心は離れ、匈奴・西羌・高句麗等周辺諸国・諸族の反感を買った。また、国内各地で叛乱が発生し、中でも18年(天鳳5年)に樊崇らが指導者となって挙兵した赤眉軍、同時期に王匡が緑林山を拠点に挙兵した緑林軍が勢力を持った。 22年(地皇3年)冬、劉秀の兄の劉縯が挙兵する。この軍は舂陵軍と称され、最初は思うように兵が集まらずに苦しんでいたが、慎重な性格と評判であった劉秀が参加すると、劉秀の判断を信じ叛乱に参加する者が増えるようになった。なお、挙兵時には劉秀は貧しく馬を買うことができず牛に乗っていた。 舂陵軍はやがて緑林軍に合流したが、まもなく緑林軍は疫病が蔓延したために、南陽を拠点として新市軍と、南郡を拠点とする下江軍に分裂した。新市軍は南陽の豪族の平林軍(この軍には劉秀の家筋に当たる劉玄が加わっていた)

    光武帝 - Wikipedia
    as365n2
    as365n2 2007/05/06
    「徹底した法家思想の政治方針で」「儒家的な思想は一切なく」「儒家である士大夫たちに不評」
  • Twitter検索がRSS対応になりました

    既にお気付きかと思いますが、Twitter検索がRSS対応になりました。 キーワード検索の検索結果をお好きなRSSリーダーで見ることができます。 同じキーワードを定期的にチェックしたい方は活用してみてください。 ↓のような使い方が面白いかも。 自分のユーザ名で検索。 =>自分宛に書いた投稿をチェック 気になるキーワードで検索。 =>キーワードに合致する投稿をチェック でも検索結果が0。 =>いつか誰かが書くかもしれないので、いちおうRSS購読(by @jazzanovaさん) RSS対応の背中を押して下さった@nitoyonさん、@otuneさんありがとうございました。 コメント (Close):8 nirvash 07-05-04 (金) 16:30 検索に含めないユーザの指定 (酢鶏とか酢鶏とか酢鶏とか)が出来るとうれしいです。とりあえず鳥さんは Block した>< shinbara

  • 盗撮取締は明らかに違法行為 - 大石英司の代替空港

    すみません。今日、私はパリからの移動日なので短縮モードです(~_~;)。 良いじゃないか! 連休でも仕事に忙殺されてて悪いかヽ(`Д´)ノウワァァン!!。 しゃあないわな。自営業、土日選べないんだから。 ま、良いですよ。一番悲しいのは、たぶんサラリーマンとかでありながら、連休中、どこに行く予定もなく、映画観るでなく家でぷらぷらしている人々だろうから、仕事に追われるだけ幸せと思わなきゃね。 新聞休刊日っていつなんでしょう。明日? GWくらい一週間休んで良いと思うんですけどね。てか、せめて後半の二日間くらいは、連ちゃんで休刊すべきですよ。配達員、旅行も出来ずに可哀相じゃないですか。 日人って、金属信仰がありますよね。金属は硬い壊れない、みたいな。ただあらゆる物質は劣化するわけで、使用状況の過酷さを考えると、はたしてメンテナンスのスケジュールがね、そんなもんでオッケーなの? と驚いてしまうわけ

    盗撮取締は明らかに違法行為 - 大石英司の代替空港
    as365n2
    as365n2 2007/05/06
    ビーチバレー「盗撮」。「新聞社が率先して、明白な違法行為を煽り、個人の権利を踏みにじるような記事を書いて良いのか?」
  • ひとりごと - IKIMONO net club

    as365n2
    as365n2 2007/05/06
    「人からそれを指摘されて涙目になったりしているくらいになったら、ある日後頭部をはたきに行く、という妄想を勝手にして楽しみに待っている」
  • k-m.jp

    k-m.jp 2024 著作権. 不許複製 プライバシーポリシー

    as365n2
    as365n2 2007/05/06
    という名前らしい。
  • ブログちゃんねる:ニコニコ動画って著作権侵害しまくりなのになんで何も言われないの?

    1 :名無しさん@お腹いっぱい。 :2007/04/16(月) 10:57:47 ID:O/It/2Ui0

  • コトノハ - たけのこを食べるとみんなのためになる

    as365n2
    as365n2 2007/05/06
    「風が吹けば……」ですらないと思ったのだが。
  • 牧野富太郎 - Wikipedia

    牧野 富太郎(まきの とみたろう、1862年5月22日〈文久2年4月24日〉 - 1957年〈昭和32年〉1月18日)は、日の植物学者。高知県高岡郡佐川町出身。位階は従三位。 「日の植物学の父」[注釈 1]の呼び名で一般に広く知られ[3]、日各地に牧野の名前を冠した顕彰施設が存在する。多数の新種を発見し、命名も行った近代植物分類学の権威である。その研究成果は50万点もの標や観察記録、そして『牧野日植物図鑑』に代表される多数の著作として残っている。旧制小学校中退でありながら理学博士の学位を取得した。誕生日である4月24日は「植物学の日」に制定された[4][信頼性要検証]。 94歳で死去する直前まで、日全国をまわって膨大な数の植物標を作製した。個人的に所蔵していた分だけでも40万枚に及び、命名植物は1,500種類を超える。財団法人板垣会顧問[5]。 1862年(文久2年)、土佐国

    牧野富太郎 - Wikipedia
    as365n2
    as365n2 2007/05/06
    「日本の植物学の父」
  • Rauru Blog >> Blog Archive >> 日本人の国語力

    as365n2
    as365n2 2007/05/06
    「帰属証明」。守旧派vs「言葉は生き物」派。via ultravioletの人