タグ

文字に関するucqのブックマーク (3)

  • 注音符号 - Wikipedia

    注音符号(ちゅういんふごう、ちゅうおんふごう、繁: 注音符號、注音: ㄓㄨˋ ㄧㄣ ㄈㄨˊ ㄏㄠˋ、拼音: Zhùyīn Fúhào ジューインフーハオ)とは、中国語の発音記号の一つ。現在は主に台湾で用いられる。先頭の四文字「ㄅㄆㄇㄈ」からボポモフォ(ブォプォムォフォ、bopomofo)とも呼ぶ。 注音符号は古代の篆書・古文などから字形の簡単なものを取って表音文字として使うもので、1文字から3文字で(声調を除く)中国語の1音節を表すことができる。中国大陸における中華民国期に制定された。中華人民共和国では漢語拼音が使われ、注音符号はほとんど使われていないが、台湾では今でも現役で使われている。 現在の注音符号は声母(音節頭子音)21字と韻16字の37文字からなる。日語の仮名に似た文字もあるが、仮名と違って音節文字ではない。また、仮名が草書体や漢字の偏旁の利用によって作られているのに対し、注音

    注音符号 - Wikipedia
  • UTF-8の冗長なエンコードとは何で、なんでそれがセキュリティ的に危ないのか?を文字コード知識レヴェル3くらいの凡プログラマが考えてみる - tohokuaikiのチラシの裏

    何故かあたり前にならない文字エンコーディングバリデーション | yohgaki's blog ってあるように、いまいち文字コードの不正な判定による危険性ってのが分かってない。 SJISの問題は、(2/3)SQLインジェクションを根絶!セキュア開発の極意 - 第5回■注目される文字コードのセキュリティ問題:ITproの記事がわかりやすかった。 というか、やっぱりPHP使ってると誰でも一度は「なんじゃこの『¥』は?」って思うもんなんで。 なるほど、確かに↓の図のように「あるバイト」が2つの意味を持つっていう文字コード形態はやばいんだなと。 EUC-JPはそんなことはしないで、1つのバイトには1つの意味しか取らせない。 だけど、これでも文字化けが起こることがある。経験的には、「マルチバイトをXX文字で切り落としたい」とかやった場合。ちゃんと文字コードを判定してくれるPHPでいえばmb_subst

  • ひらがな萌え - とくにあぶなくないRiSKのブログ

    おっと,私はすでに萌えてるので酔っているのと同じでした。すなわち,まともな理性,冷静さが失われていると。これらの文章も酔っぱらった状態で書いているのと変わりないんだ。あーそうか。と1人で納得したところで今日のネタ。 →日刊良スレガイド:よく見るとひらがなってすげえ前衛的な形してるよな これを読んだ当初は「みんなバカだろ」って思ってましたが,今日理解しました。ひらがな萌えす。 「ゆ」を考えたの誰? やばいよ,これ。しかも音もいい。というわけで,今日はすばらしい「外見」と「声」の両面にスポットを当ててひらがなをご紹介いたしましょう。 かわゆい外見 ゆ ふ の い うぉーぃ... やばいよ。やばいよ。これ以上紹介したら私が死んでしまうので次行きます。 かわゆい声 や行(ya,yu,...) う行(u,ku,...) な行(na,ni,...) じゃ,次。両方を伏せ持つRiSKオススメはこの子たち

    ひらがな萌え - とくにあぶなくないRiSKのブログ
    ucq
    ucq 2008/11/30
    同意しますw
  • 1