タグ

Unicodeに関するtsupoのブックマーク (29)

  • ゼロ幅文字にエンコードした隠し情報で、文書をリークしたメンバーを特定 | 秋元@サイボウズラボ・プログラマー・ブログ

    とある会員制掲示板からの文書の流出に困った運営者が、ユニコードの見えない文字「ゼロ幅文字(Zero-Width characters)」を使って流出させたユーザーを特定した、という話が出ていました。 数年前の話、Tom さんが所属していた競技ビデオゲームのチームでは、ログインが必要なプライベートの掲示板を使って連絡していました。その掲示板に書かれた秘密情報や戦術に関する重大アナウンスなどがしばしば掲示板外のウェブにコピペされ、チームにとって大きな問題となっていたそうです。 外部ユーザーの攻撃で中身が漏れたというよりは、メンバーの誰かがコピーしているのでは、と考えた Tom さんは、当時気になっていたユニコードのゼロ幅文字を使ったトリックを仕掛けたそうです。 ユーザーを特定する情報を、見えない文字に変換して埋め込む ログイン中のログインユーザーのユーザーIDを、一定のルールによってゼロ幅文字

    ゼロ幅文字にエンコードした隠し情報で、文書をリークしたメンバーを特定 | 秋元@サイボウズラボ・プログラマー・ブログ
  • 「絵文字に平等をサポートしてください」人種差別の指摘にゆれるUnicode 

    tsupo
    tsupo 2014/11/05
  • The Typekit Blog | Source Han Sansの紹介:オープンソースのPan-CJK書体

    アドビは、Googleとのパートナーシップにもとづいて、Source Han Sansのリリースを発表しました。この書体は、新しいオープンソースのPan-CJK書体ファミリーであり、Typekitからフォントを入手してデスクトップで使用できます。Typekitアカウントをお持ちでない場合でも、セットアップは簡単におこなえ、無料ですぐにSource Han Sansフォントを使い始めることができます。オリジナルのソースファイルを使用したい方は、GitHubのダウンロードページから入手できます。 Source Han Sansは、7つのウエイトが利用可能で、日語と韓国語で用いる文字および中国語で用いる繁体字と簡体字のグリフのバリエーションすべてに完全に対応する 書体ファミリーです。さらに、評価の高いSource Sansファミリーのラテン文字、ギリシャ文字、キリル文字も含まれます。ファミリー

    The Typekit Blog | Source Han Sansの紹介:オープンソースのPan-CJK書体
    tsupo
    tsupo 2014/07/17
    「Lunde博士は、世界的に著名なCJKVフォントの専門家であり、最終的なグリフ集合とUnicodeとグリフとのマッピングの仕様、各パートナーとのやり取りとグリフのデータの統合、最終的なフォントリソースの作成を管理しまし
  • 全角チルダ問題

    株式会社メルカリ様で行われた第2回CircleCI ユーザーコミュニティミートアップでの資料です。 #circlecijp

    全角チルダ問題
    tsupo
    tsupo 2014/07/06
    長音って、新井白石が初出なのか
  • 携帯・PHS各社、メールの絵文字を共通化 Unicodeに対応

    携帯電話・PHS6社は4月24日、キャリアメールとSMSで使える絵文字の数と種類の共通化を5月以降順次始めると発表した。従来は他社ユーザー宛てに送ったメールの絵文字が「〓」表示に置き換わるケースがあったが、今後は同じ文字が共通に表示されるようになる。 発表したのは、NTTドコモ、KDDI、沖縄セルラー電話、ソフトバンクモバイル、イー・アクセス、ウィルコム。

    携帯・PHS各社、メールの絵文字を共通化 Unicodeに対応
    tsupo
    tsupo 2014/04/24
    キャリアメールとSMSをUnicodeに対応させることで絵文字の数と種類を共通化する / 今後は同じ文字が共通に表示されるようになる → ようやく共通化される
  • 「ユニコードは犯罪だからやめてください」の衝撃 - yanok.net

    新年早々、大笑いしてしまったこと。 下らないといえば下らないので書くまでもないかと思ったのですが、後で忘れた頃に読み返すと面白いかもしれないので書きとめておくことにします。 何があったのかは下記のページに詳しく書かれてあります。こちらを読んでいただければ、ぶっちゃけそれ以上のことはないです。 「LINEウイルス」の正体とは―LINE内で流行する「ウイルス攻撃」の現状について 簡単にまとめていうと、 LINE上で「ウイルス」なるものを送りつけることができるという噂があって、実際にそれを送りつけられるとLINEのアプリが誤動作(重くなる)らしい 実際のところ、ここで「ウイルス」と呼ばれているものはある特定の文字列である (プログラムではない。であるからしてウイルスでもない) 特定の文字列を受け取ると動作が極端に重くなる不具合のあるアプリがある、というのが真相らしい 問題を引き起こす文字列は、U

    tsupo
    tsupo 2014/01/11
    ……
  • Unicode標準6.3が公開、日中韓の互換表意文字改善

    Unicode Consortiumは、Unicode標準バージョン6.3を発表した。日語・中国語・韓国語の互換表意文字に関する改善などが盛り込まれた。 Unicode Consortiumは2013年9月30日、Unicode標準の更新版となるバージョン6.3を発表した。日語・中国語・韓国語で使われている、字形が異なるが同じ意味の文字(互換表意文字)に関する改善などが盛り込まれた。 公式ブログによると、バージョン6.3のUnicode双方向アルゴリズム(Bidirectional Algorithm)では、丸カッコやかぎカッコの組み合わせのレイアウト一致を図り、カッコの表示方法や位置などを調整したという。また、テキスト処理を孤立化させる仕組みを提供し、別々のソースからメッセージを、文字の順番を乱すことなく組み立てられるようにした。 日中韓の言語への対応では、1002文字の日中韓の互換

    Unicode標準6.3が公開、日中韓の互換表意文字改善
    tsupo
    tsupo 2013/10/03
    1002文字の日中韓の互換表意文字について、新たに標準化バリエーションシーケンスを追加して、何らかのプロセスで文字が正規化されると形が変わってしまうなど、互換表意文字に関してよく知られた問題に対応
  • バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    そんなわけで、アイルランドがUCS(Unicode)に押し込んだ3つのハンドジェスチャーのうち最後の1つが、これなんだけどね。 わあ! またやばそうなのが来ました! これがやばく見えるなら、それは心の鏡に映ったきみ自身のやばさを見てるんじゃないかな。 ちょっと何言ってるかわかんないです。 『スタートレック』って観たことある? わりと最近のリメイク版なら観ましたけど。 んー、それはリメイク版じゃなくて、映画版の第11作だろうな。まあ、そんなことはいいんだけど、つり眉でおかっぱ頭でエリートくさいスポックっていうバルカン星人が出てきたでしょ? 名前は忘れましたけど、いましたね、おかっぱ星人。 で、そのバルカン星人のスポックが、手をこんな形にして「長寿と繁栄を!」って言ってなかった? 言われてみれば、そんなシーンがあったような、なかったような。 それがバルカン式挨拶(Vulcan salute)だ

    バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    tsupo
    tsupo 2013/04/23
    「ちんぴょろすぽーん」が採用される日も近い
  • 「Unicode 6.0」が策定、絵文字が国際標準に

    tsupo
    tsupo 2010/10/14
    日本の携帯電話で利用される絵文字だけではなく、インドの通貨「ルピー」を示す絵文字なども含まれる → 結局、国旗はどうなったのかな。特定の国の国旗しか採録されてないので云々問題
  • 絵文字が開いてしまった「パンドラの箱」第6回--Google・Apple提案とそのシナリオ

    WG 2ダブリン会議に持ち込まれた絵文字の提案 2009年4月21日火曜日、ここはイギリスのお隣、アイルランドの首都ダブリン郊外です。広大なキャンパスをかまえるダブリン・シティ大学の一画では、前日から11カ国のナショナルボディ(以下、NB)と2つの組織のリエゾンメンバー(連絡担当会員)が集まって、第54回WG 2会議が開かれていました。 大学の正門から真っ直ぐに延びた広い道を100メートルばかり行った突き当たりに、巨大なる工学部校舎が建っています。その建物の奥深く、2階にあるミーティングルームでは、先ほどから重苦しい空気が立ちこめていました。 ここで開かれていたのはWG 2の会議ではなく、特定のテーマを扱うアドホック会議です。「Ad-Hoc Committee on Emoji Encoding」(以下、Emojiアドホック会議)。──そう、2月のUTC会議を無事に通過したGoogle

    絵文字が開いてしまった「パンドラの箱」第6回--Google・Apple提案とそのシナリオ
    tsupo
    tsupo 2010/01/29
    第6回。こんなに長期の連載になるとは
  • 自分の持ち場を守ること - もじのなまえ

    どうもご無沙汰をしております。前回エントリから1ヵ月以上ですか。この間、「もじもじカフェ」があったり(たくさんの方に足を運んでいただき、ありがとうございました)、明日にはいよいよ漢字小委員会で最終答申案が発表される予定だったりと、けっして書くネタに困るような状況ではなかったのですが、ここ1ヵ月はブログどころではなかったのが実情でした。 では、なにをやっていたかというと、仲間とともに以下のような文書を作っておりました。 A Proposal to Revise a Part of Emoticons in PDAM 8[「PDAM8におけるEmoticonに対する修正提案」PDF/1.1MB] ISO/IEC 10646を審議するWG2委員会への寄書。絵文字についてです。 昨年11月にGoogle絵文字をUnicodeに収録する計画を発表しました。これは順調にすすみ、今年2月にUnicod

    自分の持ち場を守ること - もじのなまえ
    tsupo
    tsupo 2009/10/24
    「PDAM8におけるEmoticonに対する修正提案」 / 今年4月に開催されたWG2ダブリン会議で、アイルランドとドイツからグリフデザインその他を大きく変更することが共同提案されたのですね。これが大問題
  • そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記

    文字コードの標準化について日記を書いたのだが、内容がいまいちだったのでボツにして気を取り直してUnicodeについて一言いっておくことにする。先日、といっても昨年(2008年)の10月なんだけど、その中でちょと文字コードの標準化について話をしている。*1 もう1つ自分の経験としてあるのが、漢字の文字コードがあるんですけど、番号で言うとJIS X 0208とか0212とか規格の番号で皆言うわけなんですけど、実は1988年にその日語の文字コードの改正の委員会にいたんですね。 その当時、私は 30歳ぐらいなんですけど、「富士通」とか「日立」とか「NEC」の部長さんぐらいの偉い人たちが来てて、私なんか外資系で且つ30前後のぺーぺーだから、全然格下なんですよ。 そういうところで議論の主軸を担ってるのは、「富士通」「日立」「NEC」「日IBM」「東芝」「沖」、外資でいえば「ユニシス」とかの錚々たる

    そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記
    tsupo
    tsupo 2009/04/21
    Unicode は fj.* ではかなり忌み嫌われてた。ISO-2022 ベースで世界中の文字を全部取り込む、という方向もあったのに、結局、そっちには行かなかった。エスケープシーケンスで切り替えるのが面倒、複雑というのが障壁
  • 絵文字が開いてしまった「パンドラの箱」第3回--Unicode提案の限界とメリット

    前回までを振り返る--Unicodeコンソーシアムの影響力 前回はどこまでお話ししましたっけ。世界中の文字の収録を目的とした文字コード規格、Unicodeは、米国のIT企業を中心に結成されたUnicodeコンソーシアムが制定するデファクト規格に過ぎないこと。しかし公的な国際機関が定めるデジュール規格ISO/IEC 10646と同期することで、WTO/TBT協定にもとづき世界中の国々に普及させられるメリットを得たこと。 また、Unicodeコンソーシアム自体はオープンな組織だけれど、意志決定を行うUTC(Unicode Technical Committee/Unicode技術委員会)で一票を投じる権利を持つのは一握りの団体に限られること。そしてUTCはISO/IEC 10646のアメリカ・ナショナルボディであるL2委員会と合同でしか開催されておらず、同時にL2委員会とUnicodeコンソー

    絵文字が開いてしまった「パンドラの箱」第3回--Unicode提案の限界とメリット
    tsupo
    tsupo 2009/03/19
    色と動き / ソース・セパレーション・ルール / フォールバック対応 → 確かに複雑すぎるwww
  • 絵文字が開いてしまった「パンドラの箱」第2回--Googleの開けてしまった箱の中味

    じつはコメントを送っていたNTTドコモ 最初に前回のおさらいをしておきましょう。スタート当初の携帯電話の絵文字には、キャリア間でメールのやり取りの中で文字化けしてしまう欠点があったこと、それを解決する仕組みをキャリア各社が作ったものの、その場しのぎの欠点の多いものであったこと、そして絵文字のUnicode符号化というのはそうした欠点を一挙に解決するはずであること。ついでにGoogle絵文字のUnicode符号化を進めることで、キャリア各社は今まで自分たちが育ててきた絵文字の主導権を奪われてしまうということも。 それから前回の最後では、キャリア各社に対してGoogleの提案についてどう思うか、パブリックレビューに参加する意向があるかを聞いてみました。そこでの回答は、各社そろって消極的と受け取れるものでした。 ところが前回の掲載後に、NTTドコモがGoogle絵文字メーリングリストに投稿し

    絵文字が開いてしまった「パンドラの箱」第2回--Googleの開けてしまった箱の中味
    tsupo
    tsupo 2009/03/06
    1月14日にNTTドコモがGoogleの絵文字メーリングリストに投稿している / さらに、1月31日にNTTドコモは具体的な問題点を指摘するコメント // 当初の絵文字セットをすべて符号化する → unification はしないということで OK?
  • グーグル、絵文字を世界共通化へ--オープンソースプロジェクト開始

    グーグルは日の携帯電話の絵文字を、世界に広める存在になりたいようだ。 11月27日にGoogle Japan Blogに投稿されたエントリによると、グーグルは日の携帯電話の絵文字の全てを、ユニコードの文字として共通符号化する考えだという。 絵文字はもともと日の携帯電話会社が固有のものを使っており、異なる通信会社同士で絵文字を送り合うことはできなかった。現在では各キャリアが協力して、お互い似たような絵文字がある場合には、変換して表示している。 グーグルはこれを拡大し、絵文字をユニコードとして標準化することで、どの通信事業者間で送った絵文字も同じように表示される世界を実現したいという。さらに、「検索エンジンで絵文字を探せば、結果が返ってくる」(グーグル ユニコードソフトウェアエンジニアのMarkus Scherer氏)ようにもしたいとのことだ。 このグーグルの野望を実現するためには、現在

    グーグル、絵文字を世界共通化へ--オープンソースプロジェクト開始
    tsupo
    tsupo 2008/11/27
    関連ドキュメントを見てみたら、ウィルコムの絵文字が完全に無視されていることがわかった
  • Emoji Symbols (Unicode Symbols)

    This proposal has been approved, and Emoji symbols were added in Unicode 6.0. They have been growing and flourishing since then. The rest of this page (and much of this site) is only of historic/archival interest. The proposal for encoding of Emoji symbols as Unicode characters covers the Emoji symbols that are in widespread use by DoCoMo, KDDI and Softbank for their mobile phone networks. These s

    tsupo
    tsupo 2008/11/27
    Google uses Private Use mappings to represent Emoji ("picture character") symbols in Unicode text. The emoji4unicode project makes these mappings available. This project also provides data and tools that can be used in the development of the encoding proposal. The tools are Python scripts that provide for consistency checks, reports on the data, and chart generation.
  • 携帯の絵文字のUnicodeへの収録 - Cafe Babe

    先ほど,日の携帯で使われている「絵文字」のUnicodeへの収録を検討していることと,そのためのデータがGoogleのブログで発表された.詳細は以下を見て頂きたい. Emoji for Unicode: Open Source Data for the Encoding Proposal(Google Code) Googleの日語ブログでも,もうすぐ日語訳(?)を公開するそうである(追記:公開された.).この案は,将来的にISO/IEC JTC 1/SC 2に提案することになると思われる. この提案で誤解して欲しくないことは,この提案は,既存の携帯の変更を伴わないことである.つまり,この提案は,例えばGmailのような複数の携帯キャリアの絵文字を扱わねばならないシステムを意図したものであり,従来私用領域(Private Use Area)に割り当てていた文字を正式に符号化すると共に

    携帯の絵文字のUnicodeへの収録 - Cafe Babe
    tsupo
    tsupo 2008/11/27
    「この提案で誤解して欲しくないことは,この提案は,既存の携帯の変更を伴わないことである.つまり,この提案は,例えばGmailのような複数の携帯キャリアの絵文字を扱わねばならないシステムを意図したものであり,従来私用領域(Private Use Area)に割り当てていた文字を正式に符号化すると共に,その相互変換のためのマッピングも定義する」
  • ke-tai.org > Blog Archive > Googleが絵文字のユニコード符号化を提案しているようです

    Google絵文字のユニコード符号化を提案しているようです Tweet 2008/11/27 木曜日 matsui Posted in ニュース | 2 Comments » Google Japan Blogにケータイに関連する興味深い記事がありましたのでご紹介します。 Googleが日国内のケータイ絵文字をユニコードの文字として符号化するよう提案しているようです。 → Google Japan Blog 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ [googlejapan.blogspot.com] なんだか一見難解でよくわからない内容ですが、こちらのブログがわかりやすく解説してくれています。 → Cafe Babe 携帯の絵文字のUnicodeへの収録 [d.hatena.ne.jp] つまり、まとめるとこういうことでしょうか。 日のケータイ絵文字をユニコー

    tsupo
    tsupo 2008/11/27
    「ドコモやauで男女マークを出していたつもりが、ソフトバンクでは便器が表示されてしまうという事態になったことがあります」
  • 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

    絵文字のユニコード符号化: 符号化提案用のオープンソースデータ
    tsupo
    tsupo 2008/11/27
    Jaiku の絵文字とか、てっきり Blackberry 由来で、絵文字文化は日本固有のものじゃないと思ってたんだけど、違うのかなぁ? // 日本の携帯絵文字の全てをユニコードの文字として共通符号化しようという提案が進行
  • Googleが携帯電話の絵文字をUnicodeに提案 - もじのなまえ

    漢字小委員会の模様について、たくさんの皆さんに興味を示していただいたようでありがとうございます。つづきは時間を見て書きます。まだ皆さんにお知らせしなければならないことは残っている。 今回はまた別のお話。国際化の世界でよく知られているエンジニア、風間一洋さんのブログで「携帯の絵文字のUnicodeへの収録」というエントリが公開されました。これによると、Googleが携帯電話の絵文字をUnicodeに提案しようとしているそうです*1。 Emoji for Unicode: Open Source Data for the Encoding Proposal 非常に興味深い動きです。このエントリでは「もうすぐ日語訳(?)を公開するそうである」とされていましたが、すでに公開されています。仕事が早い。 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ ご存知のように、携帯電話での絵文

    Googleが携帯電話の絵文字をUnicodeに提案 - もじのなまえ
    tsupo
    tsupo 2008/11/27
    「もしかしたら今回の絵文字のUnicode提案の動きは、後から考えると大きな結節点となるものなのかもしれません。そのためにも現に日本で運用されている絵文字と矛盾のない提案が必要です」