Googleの従業員で構成されるグループが、Unicode Consortiumに先頃提出した文書(PDFファイル)の中で、「女性のキャリアの多様性を強調し、あらゆる場所の女性の地位を向上させるという目的の下、女性と男性の多様な職業を表す新しい絵文字セット」を提案した。Unicode Consortiumは絵文字を含む文字コードの規格化を担当する団体だ。 それら13種類の絵文字には、ヘルスケアワーカーや科学者、ビジネスパーソン、さらにはロックスターまでもが含まれる。これらの職業は、現代の全労働人口を最も端的に表すものは何か、という基準で選ばれた。「女性労働者を表す絵文字の割合を高める緊急の必要性」が主な懸念だったが、今回提案された新しい職業絵文字には、すべて男性版も用意されている。 絵文字で問題意識を高めようとすることは、それほど突飛な考えではない。コンドームブランドのDurexも今週、「
iPhoneでメッセージを送る時に「歯を見せて笑う」という絵文字を選んでも、メッセージを受信するNexusでは表示される絵文字の表情が微妙に違う、ということがしばしば起こります。この現象が絵文字ベースでコミュニケーションを取っている人々の間で誤解を起こしていることが、新たな調査で判明しました。さらに、全く同じ絵文字でも人によっても感情の受け取り方に違いがあるとのこと。 Investigating the Potential for Miscommunication Using Emoji | GroupLens http://grouplens.org/blog/investigating-the-potential-for-miscommunication-using-emoji/ (PDFファイル)“Blissfully happy” or “ready to fight”: Vary
RailsがMySQLのcollationをサーバー側のデフォルトのutf8_general_ciからutf8_unicode_ciにわざわざ変えてるのどうせ大した理由じゃないだろと思って掘ってみたらやっぱり大した理由じゃなかった… https://t.co/6NeetGhTF0— Ryuta Kamizono (@kamipo) April 18, 2014 Railsでcollationとしてutf8_unicode_ci(RailsのDEFAULT_COLLATION)が採用されるのはcharsetが未指定もしくはutf8(RailsのDEFAULT_CHARSET)のときだけで、utf8mb4にすることとかは全く考慮されてない。— Ryuta Kamizono (@kamipo) April 19, 2014 @frsyuki MySQLのcharset utf8のときのデフォルト
CVE-2014-9390 aka "Git on case-insensitive filesystems" I did not give the… gitが影響を受けた、HFS+で、一部の文字を区別しなかったり無視したりする問題に対して、Linusが吠えている。 マジで、HFS+はたぶん最悪のファイルシステムだな。クソすぎるぜ。NTFSもutf8の正規化で似たような問題(/の非正規化された表現を使用)があったが、まあ、今は修正されたんだろうよ。OS Xの問題は根本的すぎる。 そりゃ、古いさ。そりゃ、データ保護がクソすぎるってのはあるさ。だが、そういうのは、単に「すげーファイルシステムじゃない」って問題だ。「自分のケツすら拭けないマヌケによって設計された信じがたいクソ」ってわけじゃない。 HFS+の恐ろしさは、すげーファイルシステムではない、ということではない。いいアイディアがあると信じ
Earlier this year, we collaborated with our friends at @Iconfactory on a set of 872 beautiful emojis so Tweets containing emoji characters would look as sharp on the web as they do in mobile apps. Now we’re pleased to announce that these emoji are available as an open source library to the developer community at large. Since we’ve gotten many requests to use our emoji in various projects, as of to
米Twitterが絵文字をオープンソース化し、GitHubでソースコードを無償公開した。Web版で使用している、Unicodeで規定された872個の絵文字を利用できる。 日本のフィーチャーフォン文化に端を発する絵文字は、UnicodeによるサポートとiOSへの標準搭載などがきっかけに世界中で使われるようになっている。英語圏では絵文字だけのチャットサービス、SNSなども登場している。 Unicodeで標準化されたとはいえ、各社がプロダクトに用いる際は独自にデザインしなければならず、多数の絵文字に対応するのは簡単なことではない。Twitterでも、チューリップ型の「名札」、打ち上げ式ではなく手持ちの「花火」など日本の文化・風習と結びついたものが多いため、米本社で働く日本人エンジニアが1つずつレビューしながら制作したという。 ソースコードはMITライセンス、グラフィックスはクリエイティブ・コモン
世界中のあらゆる文字や記号を一望できるという「世界の文字と記号の大図鑑 ―Unicode 6.0の全グリフ」。 なんとUnicode 6.0の全グリフが1冊の本に掲載されており、実はこの本、発売前から何やらすごい文字本が出る…という噂で話題となっていました。 ドイツで出版されたdecodeunicodeが原書であり、日本版の監修はタイポグラフィ書籍であるタイポグラフィ・ハンドブックの小泉 均さんが担当されています。 Photo by Shinya Hirose(廣瀬真也) decodeunicodeの日本版が世にでるまで 今回監修者の小泉さんに簡単ながら取材をさせていただきました。本レビュー記事についても監修いただいています。 まず、とにかく版権の交渉やコスト面が大変だったとのこと—様々な困難を乗り越えてようやく出版することができたそうです。 ドイツの原書の方は、特に漢字であるCJK (C
世界規模で文字コードを制定している団体であるユニコードコンソーシアムが最新バージョンとなるUnicode 7.0を発表し、その中には250種の絵文字が含まれていることが明らかになりました。 The Unicode Blog: Announcing The Unicode Standard, Version 7.0 http://unicode-inc.blogspot.jp/2014/06/announcing-unicode-standard-version-70.html New Emoji http://emojipedia.org/new-emoji/ ◆Unicodeと絵文字の関係 スマートフォンなどで表示されている絵文字の多くは文字コードの業界規格であるUnicode(ユニコ-ド)に定められており、すべてに固有のコードが割り当てられています。たとえばメールなどで使う人も多いと思
ごあいさつ 皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。 今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。 固定観念を捨てよう 「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。 特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。 このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。 しか
※2014/4/17 記事の内容に関していくつか訂正させていただきました。 ご指摘いただいた皆様ありがとうございました。 誤字脱字を修正しました。 ソースコードの間違いを修正しました。 BOMの記述を分かりやすい表現に修正しました。 合字に関する記載を追記いたしました。 こんにちは。 Yahoo! JAPANで通知プラットフォームの開発をおこなっています佐々木海(@Lewuathe)と申します。 普段は全社向けのPush通知プラットフォームやメール配信プラットフォームの開発、保守をしています。通知というのはPush通知にしろ、メール配信にしろ基本的には「テキストデータ」を送ることになります。プラットフォーム内ではこれらのテキストに対してさまざまな処理をかけることになるのですが、さすが日本語といったところでしょうか、一筋縄ではいかない部分が出てきました。具体的にはUTF-8でエンコーディング
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く