タグ

文字コードに関するfuruichiのブックマーク (7)

  • PDFのコピペが文字化けするのはなぜか?~CID/GIDと原ノ味フォント~

    PGOを用いたPostgreSQL on Kubernetes入門(Open Source Conference 2023 Online/Hokkaido...NTT DATA Technology & Innovation

    PDFのコピペが文字化けするのはなぜか?~CID/GIDと原ノ味フォント~
  • まったく読めねェ! 「山梨県にしかない漢字」が存在する【漫画版】

    皆さんは「垈」という漢字を見たことがあるでしょうか? 「ない」と答えた方、まあそれが普通だと思います。ご安心を。 「ある」と答えた方、あなたは漢字に相当詳しいか、あるいは山梨県民ではないでしょうか。 実はこの「垈」という字、山梨県にしか存在しない漢字なのです。 マンガをまとめて読む(スワイプで次に進む) 「垈」の秘密 関連記事 「訃報」「愛」「手風琴」って読める? 常用漢字表に掲載されている“難読漢字” ニュースなどでよく見る表現も、意外と分からん……。 「稟議=りんぎ」「洗浄=せんじょう」ではない? 現代人には分からない“漢字の来の読み方” 学校のテストで書いたら、逆に減点されそう。 ディズニーランドを貸し切りにするのが異常に難しい「お金以外」の理由【漫画版】 ぐぬぬ……。 Suicaはなぜ「充電なし」でいつまでも使えるのか?【漫画版】 サイズ的に電池入ってなさそうだけど。 「大人」

    まったく読めねェ! 「山梨県にしかない漢字」が存在する【漫画版】
  • 文字コード地獄秘話 第1話:Unicodeにおける全角・半角 - ALBERT Engineering Blog

    ごあいさつ 皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。 今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。 固定観念を捨てよう 「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。 特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。 このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。 しか

    文字コード地獄秘話 第1話:Unicodeにおける全角・半角 - ALBERT Engineering Blog
    furuichi
    furuichi 2014/04/22
    20年以上前からくさかべさんが言っていたことを現代風に分かりやすく解説するとこうなる :-)
  • エディトリアル : ほら貝 北朝鮮の文字コードには「金日成」と「金正日」に特別に文字が割り振られている

    Apr05 二ヶ月ぶりの更新です。また文字コードのを書いていて、更新しない状態がつづきました。 24時間かかりきりになっているわけではないし、映画も見れば芝居にもいって、文字コードに関係のないも読んでいるのですが、文字コードというテーマは精神衛生上よくなくて、更新する気力が失せていました。 この二ヶ月間にR.A.ラファティが亡くなり、早稲田松竹が休館し、情報処理学会の標準化セッションにパネラーとして出席するというように、材料はたくさんあったのですが、文字コードにかかわっていると気分がふさいできて、ページの更新にまでエネルギーがまわせませんでした。 悪い話ばかりではなく、来月、安部公房の『幽霊はここにいる』が上演されますし、『燃えつきた地図』の映画化が決まりだそうです(監督はこのページの中にいます)。安部公房関係はこれから目が離せなくなります。 Jun22 『図解雑学 文字コード』とい

    furuichi
    furuichi 2010/05/03
    この3文字、字形も発音もまったく同じであるが、4区72位は金日成閣下専用、4区75位は金正日閣下専用で、下々の金さんは17区14位の方を使わなくてはならない。
  • Google Profileで性名を空欄にする方法 - ぬいぐるみライフ?

    Google Profileを編集した時に,First nameの欄もしくはLast nameの欄を空欄もしくはスペースだけにするとプロフィール保存時に「First and last names are required」と表示されて怒られる.この仕様のおかげで「ユーザ名はmickey24なので性や名の区別はない」「First nameの欄だけ書いてLast nameはなしにしたい」「First nameをmickeyにしてLast nameを24にすると表示名が『mickey 24』のようになって空白が入って嫌だ」という感じに困ることがある. 実は,Google Profileの氏名の欄を空欄やスペースだけにするのは認められていないが,LRO(Left-to-Right Override)という透明な特殊文字だけの場合は何の問題もなくProfileを保存することができる.LROは横書きの

    Google Profileで性名を空欄にする方法 - ぬいぐるみライフ?
    furuichi
    furuichi 2010/04/08
    ‭Unicode制御コード(RLOとLRO)。
  • 絵文字が開いてしまった「パンドラの箱」第1回--日本の携帯電話キャリアが選んだ道

    Unicodeが携帯電話の絵文字を収録へ 絵文字ってなに?そう聞かれても多くの人は、ああ、それはと答えられるはず。そう言えばちょっと前に『メールのハートマークにだまされるな! 8割の女性は「恋人以外にも使う」』(RBB NAVI)なんていうニュースもありました。携帯電話の個人普及率が9割を上回る(平成20年内閣府消費動向調査)この国において、絵文字はごくありふれたものになっている現実があります。 2008年の11月27日、Googleが携帯電話で使われる絵文字を国際的な文字コード規格、Unicodeに収録しようというプロジェクト進行中であることを発表しました。では、このニュースは何を意味するのでしょう。そして私たちに何をもたらすのでしょう。今回から3回に分けて考えてみようと思います。 まず歴史を振り返ってみましょう。じつは絵文字を使ったのは携帯電話が最初というわけでありません。先行するもの

    絵文字が開いてしまった「パンドラの箱」第1回--日本の携帯電話キャリアが選んだ道
    furuichi
    furuichi 2009/03/02
    おぐわたさんといえば、「文字の海、ビットの舟」( http://tinyurl.com/c749ke )。これに続く文字コード話を期待。
  • hori-uchi.com: mysqldumpで文字化けしないためのメモ

    ローカルの開発環境で使っていたMySQLなんですが、何も考えずデフォルトの設定で使っていたら、mysqldumpした際に、データが文字化けして、ちょっとは待ったのでメモ。 MySQLのバージョンは4.1.20。 文字化けする原因は、mysqldumpがデフォルトでは、文字コードをUTF-8で出力するようになっていて、フィールドの型がUTF-8でない場合は、自動でUTF-8に変換するためのようです。 僕が使っていたDBは文字コードについて特に何も設定していなかったので、デフォルトの文字コードであるlatin1になっていました。 なので、これもmysqldumpするとlain1 -> UTF-8な変換が自動で行われ文字化けしたということのようです。納得。 この自動変換を行わないようにすれば解決するはず。ということで調べてみると、--default-character-setというオプションを使

  • 1