タグ

ブックマーク / shiromoji.hatenablog.jp (2)

  • はてなダイアリーの文字コードがこの秋UTF-8に - しろもじメモランダム

    YAPC::Asia TOKYO 2011 で発表された「新はてなダイアリーの裏側」のスライドが公開されている。 YAPC::Asia TOKYO 2011 で「新はてなダイアリーの裏側」というトークをしてきました - 大西日記 - はてなダイアリー ブクマのコメントを見た限りではあまり文字コードの件は注目されていないが、これまでEUC-JPだったはてなダイアリーが、ようやくUTF-8になるらしい。 (スライド11枚目より) 現在のはてなダイアリーでもEUC-JP外の文字が使えないことはないが、保存時に数値文字参照に置き換えられてしまうので、後で修正しようと思ったときに面倒くさい。また、NEC選定IBM文字をそのまま記事中に書いて保存した場合には、文字そのものが別の漢字に化けてしまう。たとえば「﨑」という字はそのままだと「粼」に化けてしまう*1ため、これを回避しようと思ったら数値文字参照で

    はてなダイアリーの文字コードがこの秋UTF-8に - しろもじメモランダム
    juner
    juner 2011/10/18
    ウェーブダッシュとかどーなるか気になる。QT:はてなダイアリーの文字コードがこの秋UTF-8に - しろもじメモランダム
  • 初代ポケモンの文字コード - しろもじメモランダム

    初代ポケモン(要するに赤・緑)の文字コードの解説ページを読んだので紹介。 文字コードリスト(ポケモン版) これを読めばわかるが、外で一般に使うJISだの Unicode だのとは違い、まさにポケモン専用の文字コードになっている。8ビットコードのようだ。 [改行] や [改ページ] といった制御コードが入っているのはもちろんのこと、「わざマシン」や「ロケットだん」のような単語にコードが割り振られていたり、さらには [主人公の名前] や [(戦闘時に)行動しているポケモン] を表すコードまである。 (半)濁音は合成用の(半)濁点を表すコードを利用する(つまり(半)濁音単独のコードはない)のかと思っていたが、そうではないようだ。0x00–0x4F の範囲のうち、制御コードがない符号位置は(半)濁音ですべて埋まっている*1。ただし、(半)濁音が1コードで表されるといっても一度の処理で表示できるわけ

    初代ポケモンの文字コード - しろもじメモランダム
    juner
    juner 2011/08/13
    これは面白い。QT:初代ポケモンの文字コード - しろもじメモランダム
  • 1