タグ

文字コードに関するsobataroのブックマーク (15)

  • なぜSwiftの文字列APIは難しいのか | POSTD

    (訳注:記事をご覧の環境によって文字列が正しく表示されない場合がございます。) 投稿が遅れたFriday Q&Aにようこそ。Swiftユーザの最大の不満の一つに、 String APIがあります。Swiftの文字列APIは難しく鈍いため、多くのユーザが他言語の文字列APIのようであればと感じているのではないでしょうか。今日はなぜSwiftの String APIがこのように設計されているのか(少なくとも私がなぜそう設計されていると思うのか)を説明します。そして、基的設計の観点から見て、なぜこれが最高の文字列APIなのかを説明します。 文字列とは何か 説明に入る前に、まず基的な概念を構築しましょう。文字列について、漠然とは理解しているものの、あまり深くは考えないものなのではないでしょうか。文字列をじっくり考えることで、どのようなことが起きているのか理解することができます。 概念としての文

    なぜSwiftの文字列APIは難しいのか | POSTD
  • Engadget | Technology News & Reviews

    The best of CES 2025Presenting our 12 finalists, plus the winner of our best in show award.

    Engadget | Technology News & Reviews
    sobataro
    sobataro 2015/02/25
    Emoji Skin Tone Modifiersを導入
  • 第1回 漢字コードの基礎、JISコード

    官庁や自治体における、いわゆる行政情報システムでは、一風変わった漢字コードが用いられている。人名や地名に必要な漢字を、それぞれの省庁が思い思いの形で、情報システムに搭載してきたためだ。特集では、これら行政情報処理用漢字コードのうち、現在かなり大きなシェアを持つ3つの漢字コードの現状をお伝えしようと思う。 その3つとは、総務省系の「住民基台帳ネットワーク統一文字」、法務省系の「戸籍統一文字」および「入国管理局正字」だ。さらに、これら3つの漢字コードを一体に統合すべく構築されつつある、経済産業省系の「文字情報基盤(IPAmj)」を最終回で扱う。 ただ、これら4つの漢字コードを理解するためには、JISで制定された漢字コードの理解が不可欠なことから、第1回の今回は、「JIS X 0213」と「JIS X 0212」について、行政情報処理の視点、特に異体字処理の視点から述べることにする。 マイナ

    第1回 漢字コードの基礎、JISコード
    sobataro
    sobataro 2014/06/30
    ギョエピー
  • 特集 : 絵文字が開いてしまった「パンドラの箱」

    2008年11月27日、Googleが携帯電話で使われる絵文字をUnicodeに収録するプロジェクトを発表した。このニュースが意味することは何か。絵文字のUnicode収録の舞台裏を探る。

    特集 : 絵文字が開いてしまった「パンドラの箱」
  • Shapecatcher: Draw the Unicode character you want!

    You need to find a specific Unicode character? With Shapecatcher.com you can search through a database of characters by simply drawing your character into a box. It can find the most similar character shapes for your drawing.

  • 【2ch】ニュー速クオリティ:やたー!Unicode公認の絵文字ができたよー

    1 Pマン(福島県) 2010/10/13(水) 19:38:46.94 ID:k2CupdAz0 ?PLT(12073) ポイント特典 「Unicode 6.0」が策定、絵文字が国際標準に The Unicode Consortiumは11日、文字コード(コンピューターなどで扱うための文字の割り当て)である「Unicode Version 6.0」を策定した。携帯電話で利用される絵文字が「emoji」として取り入れられている。仕様の最終版は2011年初頭から利用できるようになるとのこと。 Unicodeは、コンピューター上でさまざまな文字を取り扱えるよう、コンピューター関連企業が参画するThe Unicode Consortiumによって策定される文字コード。今回策定されたVersion 6.0では、日発の絵文字が含まれることになった。 The Unicode Consorti

  • UTF-8 Browser Test for Unicode Block 'Arrows'

    Summary This is a test page to see how well your browser supports UTF-8 characters in the Arrows Unicode block. Detail 0x00 0x01 0x02 0x03 0x04 0x05 0x06 0x07 0x08 0x09 0x0A 0x0B 0x0C 0x0D 0x0E 0x0F 0x2190

  • MobileHackerz再起動日記: 「~」←この記号の“本当の”名前

    2010/03/05 ■ 「~」←この記号の“当の”名前 http://www.example.co.jp/~miro/index.html 最近はこういうURLの振り方はあまり流行らないような気もしますが、それでもよく見かけますよね。このURLの中にある「~」という記号。これの当の名前、知ってますか? 「~の名前がわからない!」と聞かれたら、たぶんほとんどのみなさんは「チルダ!」と即答すると思います…が、これ、じつは状況によっては間違っている可能性もあるんです。 …と、ちょっと脅してみましたが、まぁ普通は「チルダだよ!」って言っときゃ間違いないです(笑)。ここから先はかなりマニアックな話になります。 みなさんが今、目にしているコンピュータ上の文書は「文字コード」という仕組みの上に成り立っています。あらかじめ文字ごとに番号を振って、○○番の文字はこれ、○○番の文字はこれ、とお互いに決め

  • エディトリアル : ほら貝 北朝鮮の文字コードには「金日成」と「金正日」に特別に文字が割り振られている

    Apr05 二ヶ月ぶりの更新です。また文字コードのを書いていて、更新しない状態がつづきました。 24時間かかりきりになっているわけではないし、映画も見れば芝居にもいって、文字コードに関係のないも読んでいるのですが、文字コードというテーマは精神衛生上よくなくて、更新する気力が失せていました。 この二ヶ月間にR.A.ラファティが亡くなり、早稲田松竹が休館し、情報処理学会の標準化セッションにパネラーとして出席するというように、材料はたくさんあったのですが、文字コードにかかわっていると気分がふさいできて、ページの更新にまでエネルギーがまわせませんでした。 悪い話ばかりではなく、来月、安部公房の『幽霊はここにいる』が上演されますし、『燃えつきた地図』の映画化が決まりだそうです(監督はこのページの中にいます)。安部公房関係はこれから目が離せなくなります。 Jun22 『図解雑学 文字コード』とい

  • ISO/IEC 10646(≒Unicode)でなぜ「ゴミ文字」が増えていくのか?

    小形克宏 @ogwata 日の携帯絵文字を収録する国際会議に出席した話のつづき。この件は書こうか迷ったけど、書いておこう。ISO/IEC 10646(≒Unicode)で構造的に「ゴミ」文字が増えていく件。おかしな点があればぜひご指摘ください。 2010-04-25 23:46:39 小形克宏 @ogwata 一昨日のツィートで、WG 2会議は「対立を前提とした共同作業」だと書いた。自分が通したい主張を相手に呑ませるため、可能な限り妥協する。「ISO/IEC 10646のより良い改訂」という目的から、妥協は美徳とされる。互いに妥協しながら落し所を探る。これがWG 2会議の流儀だった。 2010-04-25 23:52:40

    ISO/IEC 10646(≒Unicode)でなぜ「ゴミ文字」が増えていくのか?
  • 複数行にまたがる括弧はなぜズレるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    InD-Boardで出ていた「複数行にまたがる括弧」の話が興味深かったので、ちょっと調べてみた。皆さんの指摘に付け加えるような知見はないのだけれど、以下、文字コード的な雑談として。 Unicodeには、複数行にまたがる丸括弧、角括弧、波括弧がある(下図)。このうち2文字で作る波括弧は、左上と右下、左下と右上のパーツが共通なので、文字数としては、ここまでで16文字。 これらの括弧には、拡張用の直線パーツ(下図、グレー地)が用意されている。丸括弧用と角括弧用はそれぞれ左右別々、波括弧用のみ左右共通で、文字数としては5文字。しかしAdobe-Japan1では、これら5文字がすべてCID+12167に集約されており、区別してデザインすることができない。 下図は小塚明朝。角括弧の拡張はうまくいっているが、丸括弧と波括弧は直線部分がズレている。また、2文字分の波括弧のパーツは、おそらく左右共用ではなく

    複数行にまたがる括弧はなぜズレるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • なぜUnicodeには分数の「0/3」が入っているのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Adobe-Japan1の分数は(特にUnicodeとの関係において)けっこうぐしゃぐしゃなので、ちょっと整理してみよう。下図は、横棒を使う分数のリスト*1。Proフォントでは「分数(afrc)」フィーチャで用いられる。分母が2から12までの約分できない真分数と「0/3」と「1/100」。 上図と同じ字種について、数字を斜めに配置するグリフも用意されている(下図)。これらはProフォントでは「スラッシュを用いる分数(frac)」フィーチャで用いられる*2。 上図のグリフはすべて全角だが、斜めに配置する分数の一部には、プロポーショナル・グリフも用意されている(下図)。 下図は、Unicodeに含まれる分数を、Mac OS Xの文字ビューアからInDesignに入力したもの。Adobe-Japan1ではプロポーショナル(黄色地)優先のマッピングであるため、「2/5」などの全角グリフ(グレー地)

    なぜUnicodeには分数の「0/3」が入っているのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 文字コードはなぜ複雑になるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    文字コードについて説明しようとする場合、「例外を無視して単純化すると、厳密にはウソになってしまう」という罠に陥りやすい。矢野啓介『プログラマのための文字コード技術入門』は、平易な文章でありながら、そのような落とし穴を慎重に回避することに成功していると思う。 プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ) 作者: 矢野啓介出版社/メーカー: 技術評論社発売日: 2010/02/18メディア: 単行(ソフトカバー)購入: 34人 クリック: 578回この商品を含むブログ (129件) を見る カバー・文デザインはn-yujiさん(遠近法ノート)*1なので、組版に関しても安心。 このには、「文字コードはなぜ複雑になるのか」という節が用意されており、著者は「文字コードを複雑化させる二つの理由」として、「過去の経緯の

    文字コードはなぜ複雑になるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記

    文字コードの標準化について日記を書いたのだが、内容がいまいちだったのでボツにして気を取り直してUnicodeについて一言いっておくことにする。先日、といっても昨年(2008年)の10月なんだけど、その中でちょと文字コードの標準化について話をしている。*1 もう1つ自分の経験としてあるのが、漢字の文字コードがあるんですけど、番号で言うとJIS X 0208とか0212とか規格の番号で皆言うわけなんですけど、実は1988年にその日語の文字コードの改正の委員会にいたんですね。 その当時、私は 30歳ぐらいなんですけど、「富士通」とか「日立」とか「NEC」の部長さんぐらいの偉い人たちが来てて、私なんか外資系で且つ30前後のぺーぺーだから、全然格下なんですよ。 そういうところで議論の主軸を担ってるのは、「富士通」「日立」「NEC」「日IBM」「東芝」「沖」、外資でいえば「ユニシス」とかの錚々たる

    そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記
  • 2010-02-14 - 未来のいつか/hyoshiokの日記

    例えば、次の言葉の意味を知りたい、聞いたことがあるけどよく分かっていないプログラマにとって、お勧めの書籍だ。Unicode/UTF-8/UTF-16/USC-2/JIS X0208/JIS X0212/JIS X0213/SJIS/EUC-JP/CP932/ISO-2022-JP/ASCII/Latin-1/ISO 10646/ISO 8859-1/サロゲートペア/文字化け/機種依存文字/半角カナ/絵文字… JIS X0208やJIS X0213の解説などは圧巻である。書籍にはWebにない利点がある。Webには即時性があるが、文字コードの解説においては、即時性はそれほど求められない。字体ないし字形の差異についてWebではその字体ないし字形がなければ表現しようがないが、書籍であれば細部までこだわって表現できる。 例えば、包摂された「辻」という字の一点しんにょうと二点しんにょうの字体の差はWe

    2010-02-14 - 未来のいつか/hyoshiokの日記
  • 1