並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 1897件

新着順 人気順

unicodeの検索結果161 - 200 件 / 1897件

  • Press Release: Unicode 6.0

    Unicode 6.0: Support for Popular Symbols in Asia Mountain View, CA, USA – October 11, 2010 – The newly finalized Unicode Version 6.0 adds 2,088 characters, with over 1,000 new symbols. A long-awaited feature of Unicode 6.0 is the encoding of  hundreds of symbols for mobile phones. These emoji characters are in widespread use, especially in Japan, and have become an essential part of text messages

    • Unicodeの制御文字を使いファイル名偽装、ウイルス「RLTrap」検出報告5万件 IPAが注意呼び掛け

      • 5万字を越える多漢字Unicodeフォントのリリースが相次ぐ | スラド オープンソース

        /.Jでもたびたび取り上げてきたフリーな日本語漢字フォントの花園明朝が5月16日リリース版にて、現時点でUnicodeに収録されているすべてのCJK統合漢字・互換漢字に対応した。TrueTypeフォントには1ファイルにグリフを65,535個までしか含められないという制限があるため、このバージョンからはBMPの全文字+JIS X 0213:2004の文字+IVDのAdobe-Japan1コレクションの文字をすべて含んだ花園明朝Aと、Unicodeの2面(SIP)のすべての漢字を含んだ花園明朝Bに分割されている。ライセンスは独自のフリーライセンスとSIL OFLのデュアルライセンス。 一方、経産省が昨年から公募していた文字情報基盤構築に関する研究開発事業の成果物として、IPAmj明朝(検証版)も5月18日に公開されている(Impress Watch)。こちらは日本の戸籍行政などで必要とされる文

        • 先生怒らないからリュウミンは手を挙げなさい - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

          IVSファンの皆さん、こんにちは。 いえ、ぜんぜんファンとかじゃないですから。 『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)の目玉と言えるのが、表2-7の「Windows 8におけるJIS X 0208:1990字形と異体字セレクター」だよね。 そうなんですか? Microsoftの人が執筆しているIVS本なんだから、焦点は当然Windows 8のIVS対応。皆さんそこが知りたいわけでしょ? なるほど。 そこで、この表2-7に突っ込んでみよう、と。 やっぱり突っ込むんだ……。 表のタイトルは大切だから、しっかり頭に入れておくといいぞ。「Windows 8におけるJIS X 0208:1990字形と異体字セレクター」だ。 はいはい。Windows 8ではIVSをどのように駆使して「Vistaで変更される以前のMS明朝のグリフ」を表示するのか……ってことですね。 でさ、「字形

            先生怒らないからリュウミンは手を挙げなさい - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
          • Perl 5.20がリリース - ipv6のサポート、サブルーチンの新しい文法、新しいスライス記法、Unicode 6.3への対応など - Perl入門ゼミ

            Perl › バージョン情報 › here Perl 5.20がリリースされました。今回は結構盛りだくさん。ピックアップして紹介します。 Perl 5.20で追加・変更された機能 IO::Socket::IPがコアモジュールに Perl 5.20ではIO::Socket::IPがコアモジュールになりました。Perlではソケットを使う場合にIO::Socket::INETを使っていましたが、ipv6のサポートを含めて、同一のインターフェースで利用できるモジュールのようです。 CGI,Module::Buildが廃止予定になります 長年コアモジュールだったCGIモジュールが、次期リリースでコアからはずれます。。また、ピュアPerlでmake相当のことができるModule::Buildが次期リリースでコアからはずれます。 次期リリースのPerl 5.22からは、CGIモジュールは必要であればcp

              Perl 5.20がリリース - ipv6のサポート、サブルーチンの新しい文法、新しいスライス記法、Unicode 6.3への対応など - Perl入門ゼミ
            • .NETでのUnicode合成文字の処理について調べた

              Unicodeでは,複数の文字から1つの文字を合成する仕組みがある。例えば,ヨーロッパの言語で使われているアクセント付きのアルファベットを表現するのに使われる。日本語の濁点/半濁点付きのカタカナ/ひらがなにも,この仕組みがある。例えば,「ぱ」という文字は,「ぱ」(キャラクタ・コードはUTF16で3071)という2バイトの文字と,「は」(同306F)と文字合成用半濁点「゜」(同309A)を組み合わせた4バイト文字の,2種類が存在する。そのため,濁点/半濁点付きの文字を検索する場合,2バイトの単独文字と4バイトの合成文字の両方を検索する必要が出てくるなど,文字列処理が多少面倒になる可能性がある。今回はこの合成文字について,.NETでの処理を調べた。 最初に断っておくが,キーボードからは文字合成用の「゜」(キャラクタ・コードは309A)は入力できない。入力できるのは,キャラクタ・コードが309C

                .NETでのUnicode合成文字の処理について調べた
              • 絵文字の提案について、Unicodeコンソーシアム理事長に聞いてきた👂 - Qiita

                こんばんは、@todokrです。この記事は絵文字 / Emoji Advent Calendar 2016の22日目の記事です エモジニアンと絵文字追加運動 絵文字愛好家のみなさま方におかれましては、「いつかは自分もUnicodeに絵文字追加のプロポーザルを…」という思いをごく自然とお持ちのことと思います。 世間を見渡せば「ハンバーガーやホットドッグの絵文字はあるのになんでタコスはないんだ!」とブチ切れたタコベルがタコス絵文字収録キャンペーンを始めてしまったり、「我々には餃子の絵文字が必要である」プロジェクトがChange.orgに誕生したりなどなど、敬虔なエモジニアンらによる急進的な絵文字追加運動は枚挙にいとまがないようです。 Change.orgの餃子追加プロジェクトの方では「署名の理由」欄に「私は餃子です」と書き残す謎のサンフランシスコ人がいたりなど、異様なテンションの高さが感じられ

                  絵文字の提案について、Unicodeコンソーシアム理事長に聞いてきた👂 - Qiita
                • Unicode正規化

                  正しい並び替えでは、表示は(A)のままですが、間違った並び替えでは、正規結合クラスが互いに等しいMACRONとACUTEを並び替えたため、表示は(B)のように、eの上のアクセント記号の位置が入れ替わってしまいます。 正規分解・互換分解 ある文字列の正規分解 (Canonical Decomposition) を得るには、まず、それぞれの文字を正規マッピングによって再帰的に、可能な限り、分解します。すなわち、1回分解した後に現れた文字がなおも分解可能であればさらに分解します。分解マッピングがその文字自身である場合は、分解不可能なので、そのままです。 しかし、分解しただけでは必ずしも正しい結果が得られません。つまり、結合文字の順序の一意性を保証するため、分解後の文字列に対して正規順序アルゴリズムを適用しなければなりません。このように、正規マッピングによる再帰的分解と、正規順序アルゴリズムによる

                    Unicode正規化
                  • Unicodeの脳みそ星人はどこからやってきたのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

                    ねえねえ。これ何に見える? もしかして何かエッチなこと言わそうとしてます? いや、そういうのじゃないから。 宇宙人……でしょうね。 ふーん。宇宙人に見えるかあ。 宇宙人に見えるっていうより、宇宙人とでも言うしかないというか。 うん。これ、U+1F47E ALIEN MONSTERっていうUnicode絵文字の例示字形なんだけどね。ちょっとアレだよね。その元になった携帯キャリアの絵文字は、SoftBankのインベーダーのカニ星人*1。それから、auのタコ星人。 どっちもわかりやすい宇宙人ですよね。それがどうしてこんな不吉な脳みそ星人になっちゃったんですか? 話せば長いんだけどね。 じゃあ、またの機会に……。 ま、座れよ。ケータイの世界には、SoftBankにはアリ星人(「宇宙人」)とカニ星人(「ゲーム」)がいて、auにはタコ星人(「宇宙人」)とUFOがいる。 はい。ありますね、これ。 こいつ

                      Unicodeの脳みそ星人はどこからやってきたのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
                    • The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

                      I’m Joel Spolsky, a software developer in New York City. More about me. Read the archives in dead-tree format! Many of these articles have been collected into four books, available at your favorite bookstore. It’s an excellent way to read the site in the bath, or throw it at your boss. Ready to level up? Stack Overflow Jobs is the job site that puts the needs of developers first. Whether you want

                        The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
                      • バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

                        そんなわけで、アイルランドがUCS(Unicode)に押し込んだ3つのハンドジェスチャーのうち最後の1つが、これなんだけどね。 わあ! またやばそうなのが来ました! これがやばく見えるなら、それは心の鏡に映ったきみ自身のやばさを見てるんじゃないかな。 ちょっと何言ってるかわかんないです。 『スタートレック』って観たことある? わりと最近のリメイク版なら観ましたけど。 んー、それはリメイク版じゃなくて、映画版の第11作だろうな。まあ、そんなことはいいんだけど、つり眉でおかっぱ頭でエリートくさいスポックっていうバルカン星人が出てきたでしょ? 名前は忘れましたけど、いましたね、おかっぱ星人。 で、そのバルカン星人のスポックが、手をこんな形にして「長寿と繁栄を!」って言ってなかった? 言われてみれば、そんなシーンがあったような、なかったような。 それがバルカン式挨拶(Vulcan salute)だ

                          バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
                        • エクセルで普通に開けるUnicodeなCSV - c/fe

                          文字コード:UTF-16LE(BOM必須) 改行コード:CRLF 区切り文字:tab 出オチですが。 - 昨今は多言語に対応したフォームを作ってくれ、というオーダーもちらほらありますが、お客さんは管理画面からDLできるCSVをエクセルで開くわけで、何も考えて作らないとバリバリ文字化けします。 そういう時はエディタで開くとか、エクセルなんかではなくて、Open Officeとかで開くのが順当なんですがね、そんなちゃんとしたことが出来る方は滅多にいませんし。 Excelは当然ユニコード対応してるんですけど、なぜかUTF-8はちゃんと認識してくれない。 UTF-16とかいまさら誰がつかってんの(内部コード用にはよくつかわれてますけど、ファイルフォーマットとしては、UTF-8が世界的にもデファクトちゃうの?)という気がしますし、そもそもBOMがないとやっぱりコケるのが謎すぎる。 さらに、そのUTF

                            エクセルで普通に開けるUnicodeなCSV - c/fe
                          • YAPC::Asia2009の特別研修「Perl, Unicode, and AJAX」は自由な感じの研修でした - こんにちはこんにちはmonmonです!

                            小飼弾(id:dankogai)さんのAjaxの基礎講義でした。 ただ、ダブルブッキングだったらしく、16時前にdanさんは抜けました。(一通りの説明したので研修を疎かにしてはないです) ということで、16時からはMaki(id:lestrrat)さんとEmerson Millsさんがいろんな話をしてくれました。 これが何でも聞ける形式で面白い時間でした。こっちのコーナーが一日だったとしても面白かっただろうなぁと。 今回の研修は前日のMooseの研修と違い、ほぼ自由な感じでした。なので質問とかどんどんしてなかったら多分何も得られてなかっただろうなと思います。 その分、関係ないことも色々質問できて楽しかったです。 IRCの話とかそういうの。 研修と関係ないことメモ。 danさんは<script>のことをチートと言います。 danさんはemacs使います。 ただ、今回はsyntaxの拡張とか入

                              YAPC::Asia2009の特別研修「Perl, Unicode, and AJAX」は自由な感じの研修でした - こんにちはこんにちはmonmonです!
                            • 「UnicodeによるXSSとSQLインジェクションの可能性」プレゼン資料 - ockeghem's blog

                              だいぶ間があいてしまいましたが、本年1月31日に開催された、第04回まっちゃ445勉強会目覚まし勉強会におけるライトニングトークの資料を公開します。 UnicodeによるXSSとSQLインジェクションの可能性View more presentations from ockeghem.

                                「UnicodeによるXSSとSQLインジェクションの可能性」プレゼン資料 - ockeghem's blog
                              • WeekBuildのHACK日記 UnicodeとUTF-8の違い

                                を、最近やっと知りました。 UTF-8はUnicodeを\xxxxっていう1文字が1~3バイトになる変な形式に形式に変換したもので、unicodeをファイルとかに入出力するときに使われるなんですよ。 ずっとその違いがわからなくて、SQLiteCCでTracのデータ覗いたときに、なんでunicodeなのに文字化けするんだろう???って思ってました。 (SQLiteCCはunicodeではなくutf-8をサポートしており、unicodeでSQLiteに保存した文字はSQLiteCCでは表示できなかった) 文字コードって難しい(~ヘ~;) ちなみに、 Pythonでutf-8をunicodeに変換するには、 text = unicode(text,'utf-8') Shift-jisをunicodeに変換するには、 text = unicode(text,'Shift_JIS') unicode

                                • Windows と Unicode とボク

                                  「今まで Shift-JIS しか使えなかった Windows で UTF8 が使えるようになりました!」 素人だけでなく、Windows についてろくに知らないLinuxかぶれのプログラマまでに知ったふうなことを言っています。 別に Unicode の委員会とも縁があるわけではなく、単に UNIX と Windows 、ちょっとずつだけかじっただけの、たまたま独自シェル用に ReadLine を作ってみただけに過ぎない1プログラマのワタクシが世間の Unicode の認識にグチります。 そんな怪文書、はーじまーるよー

                                    Windows と Unicode とボク
                                  • 【2ch】ニュー速クオリティ:やたー!Unicode公認の絵文字ができたよー

                                    1 Pマン(福島県) 2010/10/13(水) 19:38:46.94 ID:k2CupdAz0 ?PLT(12073) ポイント特典 「Unicode 6.0」が策定、絵文字が国際標準に The Unicode Consortiumは11日、文字コード(コンピューターなどで扱うための文字の割り当て)である「Unicode Version 6.0」を策定した。携帯電話で利用される絵文字が「emoji」として取り入れられている。仕様の最終版は2011年初頭から利用できるようになるとのこと。 Unicodeは、コンピューター上でさまざまな文字を取り扱えるよう、コンピューター関連企業が参画するThe Unicode Consortiumによって策定される文字コード。今回策定されたVersion 6.0では、日本発の絵文字が含まれることになった。 The Unicode Consorti

                                    • Java SE 7徹底理解 第7回 Unicode 6.0と国際化

                                      今回から再びJava SE 7の新機能を解説していきます。今回は、Java SE 7における国際化の拡張について紹介します。 Java SE 7における国際化の一番の目玉といえばUnicode 6.0です。 普段、Unicodeのバージョンを気にしている人はほとんどいないと思います。しかし、Unicode 6.0は少し違います。Unicode 6.0には携帯電話で使われる絵文字が含まれているのです。 Java SE 7ではUnicode 6.0をサポートしているため、この絵文字が使えるようになりました。 もちろん、Unicode 6.0に対応したフォントがあることが必要です。MacではOS X LionからUnicode 6.0に対応したフォントが含まれていますが、他のOSではなんらかのフォントが必要となります。 本記事では、和田研細丸ゴシックを使用してUnicode 6.0の絵文字を表示

                                        Java SE 7徹底理解 第7回 Unicode 6.0と国際化
                                      • Unicode6.0の携帯電話の絵文字の一覧 - Wikipedia

                                        この項目には、一部のコンピュータや閲覧ソフトで表示できない文字(Unicode 6.0の絵文字)が含まれています(詳細)。 Unicode6.0の携帯電話の絵文字の一覧(ユニコード6.0のけいたいでんわのえもじのいちらん)では、2010年制定のUnicode 6.0 で採用された携帯電話の絵文字(Emoji)の一覧と、携帯キャリアごとの対応状況について示す。 Unicode 6.1 では、文字コードを絵文字スタイルとして扱うか、テキストスタイルとして扱うかの異体字セレクタが用意された[1]。絵文字スタイルの場合は、U+FE0Fを、テキストスタイルの場合は、U+FE0Eを文字コードの後に記述する。このため、理論上は多くの文字コードに絵文字スタイルを適用することが出来るが、Unicodeでは、これらを絵文字の歴史的コードとしている。 各キャリア別の表はiモード絵文字、EZweb絵文字、Soft

                                        • PHPにおけるUnicode文字列の正規化:CodeZine

                                          はじめに 与えられた文字列を含む文書を返す検索機能を実装しているところを想像してください。 検索語として「ページ」が与えられれば、「ページ」という文字列を含む文書を返します。これは特に難しいことではありません。 半角の「ページ」が与えられたらどうでしょう。「ページ」と「ページ」を区別する必要がないような、一般的な文書検索においては、「ページ」という文字列を含む文書を返すのが望ましいはずです(もちろん、この2つは常に同一視できるわけではありません。同一視できない例として本稿があります)。 もしかしたら、「㌻」で検索しようとする人がいるかもしれませんし、日本語を母国語としない人が、「ぺ」(「ヘ」と半角の半濁点「゚」)や「ヘ゜」(半角カナ「ヘ」と半濁点「゜」)を使うかもしれません。 人間なら簡単に対応できることですが、コンピュータで対応するには特別な処理が必要になります。例えばUnic

                                          • UTF-8 Browser Test for Unicode Block 'Arrows'

                                            Summary This is a test page to see how well your browser supports UTF-8 characters in the Arrows Unicode block. Detail 0x00 0x01 0x02 0x03 0x04 0x05 0x06 0x07 0x08 0x09 0x0A 0x0B 0x0C 0x0D 0x0E 0x0F 0x2190

                                            • 「Unicode 6.0」が策定、絵文字が国際標準に

                                              • Unicodeの異体字セレクターを使ったステガノグラフィ:秘密の文字列をテキストにこっそり隠し込む方法 - Qiita

                                                Unicodeの異体字セレクター(variation selectors)を使い、ユニコード文字列内に隠し情報を埋め込む方法です。 異体字セレクターとは 異体字セレクターは、文字の字体を詳細に指定するモディファイアのようなもの 異体字セレクターは16種類のコードポイントがある(FE00~FE0F) 仕組みの概要 隠したい文字列(hidden)を文字単位にバラす (例: js → j, s) 文字ごとに16進数に変換する (例: j → 6A) その16進数をひと桁ずつ異体字セレクターのコードポイントにマッピングする (例: 6→FE06, A → FE0A) 異体字セレクターの配列をひとつの文字列にまとめなおす 最後にそれを埋め込み先の文字列(body)に混ぜ込んで隠す。 よくあるユニコードステガノグラフィーとの違い ゼロ幅文字を使ったステガノグラフィー 次のようなゼロ幅空白文字を用いたス

                                                  Unicodeの異体字セレクターを使ったステガノグラフィ:秘密の文字列をテキストにこっそり隠し込む方法 - Qiita
                                                • 携帯電話の絵文字のUnicode登録をめぐる議論の動向 - moroshigeki's blog

                                                  「第2回ワークショップ: 文字 ―文字の規範―」において、「携帯電話の絵文字のUnicode登録をめぐる議論の動向」という題でしゃべってきた。その時スライドに書いたりしゃべったことを、以下にメモしておく。 はじめに 問題の所在 2008年12月、Googleが日本の携帯電話の絵文字をUnicodeに登録するための提案を発表したところ、Unicodeのメーリングリスト上で激論が発生した(1ヶ月で600通超)。この議論の中で、しばしば反対意見の中で「規範」を持ち出した意見が出ていた。したがって、本ワークショップのテーマである「文字の規範」を考えるネタとして、おもしろいのではないかと思う。 おことわり 以下の議論の概観は、メーリングリスト(Unicode Public Email List、Google グループ)をもとにしているが、細かい議論を端折ったり、時間が離れた議論をくっつけたりしている

                                                  • 楽しい文字コード入門 知っておきたいUnicode Emoji編

                                                    Bizreach Tech Beer Bashでの発表資料です

                                                      楽しい文字コード入門 知っておきたいUnicode Emoji編
                                                    • 私の名前ってUnicodeでどう表すの?~異体字セレクタとの出会い~ - NRIネットコムBlog

                                                      本記事は 【Advent Calendar 2023】 17日目の記事です。 🎄 16日目 ▶▶ 本記事 ▶▶ 18日目 🎅 こんにちは。 2年目の草野です。年末が近づいてきましたね。 今回はAdvent Calendarの執筆に参加ということで、2023年の業務の中で印象深かったUnicodeについて少しお話したいと思います。 そもそもUnicodeとは サロゲートペア文字 突然ですが…… 異体字セレクタとの出会い 異体字セレクタって? 全く同じ意味を持つ文字、異体字 異体字セレクタの誕生 具体例 結局私の名字はどう書くの? おわりに そもそもUnicodeとは みなさんご存じの通り、Unicodeは文字を表すための国際的な標準規格の1つです。 一般的には [U+91CE] のように、16進数で表記されます。 常用文字は [U+0000] ~ [U+FFFF] の16進数4文字=2バ

                                                        私の名前ってUnicodeでどう表すの?~異体字セレクタとの出会い~ - NRIネットコムBlog
                                                      • 「Unicode 9.0」が6月21日にリリース、72種類の絵文字を追加

                                                          「Unicode 9.0」が6月21日にリリース、72種類の絵文字を追加 
                                                        • Hacking with Unicode in 2016

                                                          This presentation explores common mistakes made by programmers when dealing with Unicode support and character encodings on the Web. For each mistake, I…

                                                            Hacking with Unicode in 2016
                                                          • OS X Lion 10.7.3のAppleカラー絵文字がすごい! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

                                                            Appleカラー絵文字が変わった。OS X Lion 10.7.3では、一気に300以上の絵文字が、新たに追加されたり、カラー化されたりした。 これらは、現時点では文字ビューアの「絵文字」からは入力することができないので、見つけにくく、あまり話題になっていないようだが、大きいサイズで表示されうることを前提とした気合いの入った描き込みがすごい*1。 入力は、文字ビューアの「Unicode」から。今回掲載した絵文字は、U+1F301 FOGGY、U+1F30B VOLCANO、U+1F30C MILKY WAY、U+1F402 OX、U+1F404 COW、U+1F405 TIGER、U+1F406 LEOPARD、U+1F408 CAT、U+1F409 DRAGON、U+1F40A CROCODILE、U+1F40B WHALE、U+1F415 DOG。 *1:そのぶん、以前からある絵文字と

                                                              OS X Lion 10.7.3のAppleカラー絵文字がすごい! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
                                                            • 既存の日本語文字コードと Unicode の間のマッピングルール

                                                              • 「文字数」ってなぁに?〜String, NSString, Unicodeの基本〜 - Qiita

                                                                はじめに この記事は、第5回スタートアップiOS勉強会 - connpassでの同名の発表を文章形式でリライトしたものです。 スライド版(Speaker Deck)はこちら。 String と NSString 「文字列の特定の単語に色をつけて、textViewに表示したい」 …という、ヒトなら誰しもが持つ欲望をさらけ出してください。 そう言われたあなたは、以下のようなコードを書くかもしれません。 func coloredText(from str: String, target: String) -> NSAttributedString { // 対象単語の出現範囲( Range<String.Index> )を取得 let range: Range<String.Index> = str.range(of: target)! // Range<String.Index> を NSRa

                                                                  「文字数」ってなぁに?〜String, NSString, Unicodeの基本〜 - Qiita
                                                                • Unicode HOWTO

                                                                  サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは本日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

                                                                  • プログラミング/小ネタ集/Unicode対応コーディング - ルーチェ's Homepage

                                                                    概要 † このコンテンツは、C/C++言語でWindowsプログラミングをしていて、かつMFCやATLにある CString クラスを使っていない人くらいにしか実益はないかもしれません。 が、内容的に知っておいて損はないことなので書いておきます。 概要としては、 LPTSTR 型や TCHAR 型について知り、NT系(Unicode環境)と9x系(非Unicode環境)のどちらにも最適化できるソースコードを書こうというお話です。 TCHAR 型を見たことがなくても、 LPTSTR 型なら見たことがある人も結構いるでしょう。 初心〜中級のWindowsプログラマは、大抵は LPTSTR 型と LPSTR 型の違いを特に意識せずにコードを書いています。 しかし、この二つの型を混同するのは非常に危険なことです。 まずはこれらの型の定義を説明し、 TCHAR 型を用いることでUnicode対応プロ

                                                                    • PHPでユニコードエスケープ(unicode_encode, unicode_decode代替) - はて日記

                                                                      PHP6からは unicode_encode() 関数と unicode_decode() 関数が追加されるらしいのですが、PHP5やPHP4でユニコードエスケープをしたい時のために。 // UTF-8文字列をUnicodeエスケープする。ただし英数字と記号はエスケープしない。 function unicode_decode($str) { return preg_replace_callback("/((?:[^\x09\x0A\x0D\x20-\x7E]{3})+)/", "decode_callback", $str); } function decode_callback($matches) { $char = mb_convert_encoding($matches[1], "UTF-16", "UTF-8"); $escaped = ""; for ($i = 0, $l =

                                                                        PHPでユニコードエスケープ(unicode_encode, unicode_decode代替) - はて日記
                                                                      • Unicodeについて

                                                                        Maxyは、Unicode対応のテキストエディタです。 ところで、そもそもUnicodeって何なのでしょうか。 UnicodeとUTF-8とかUTF-16との関係は? そのあたりのことを簡単に説明していきます。 文字コードとは 日本語を扱うには? 文字化け 多言語の混在 Unicodeの誕生 サロゲートペア エンコード方式 BOM そして今… 資料 文字コードとは まずは基本中の基本だけど、(現在のところ)コンピュータが扱えるのは数値のみという大前提がある。 何をするにも数値をいじるしかない。 きれいなCGも、優雅な音楽も、つまるところ数値なわけだ。 「ここに100を書き込んで、ここに150を書き込んで…」と、コンピュータが必死になっていろんなところに数値を書き込んだ結果としてCGが表示されたり音楽が流れたりするわけ。 そんなわけだから、当然コンピュータ内で文字を表現するにも数値が必要で、

                                                                        • Japanese Unicode Fonts

                                                                          [ font samples | what's new? | related links | home | travel phrases ] Introduction Japanese is written using a mixture of three scripts: Hiragana, Katakana, and Kanji. Latin letters (Romaji) and symbols/dingbats (Kigo) are also mixed into modern written Japanese. Hiragana & Katakana are syllabaries. The Unicode Standard refers to Kanji characters as "Han Ideographs". Some Kanji are visually diffe

                                                                          • 絵文字の Unicode 符号化に関するアップデート

                                                                            メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                                                                              絵文字の Unicode 符号化に関するアップデート
                                                                            • cmd.exeとchcp.comだけで、文字コード(Unicode、UTF-8、UTF-7、JIS、EUC-JP、SJIS)を変換する! - Windows Script Programming

                                                                              cmd.exeとchcp.comだけで、文字コード(Unicode、UTF-8、UTF-7、JIS、EUC-JP、SJIS)を変換する! Unicode、UTF-8、UTF-7、JIS、EUC-JP、SJISなどの文字コードがcmd.exeとchcp.comだけで変換できます。 Unicode → 各種文字コード UTF-7.cmd Unicodeファイル UTF-7ファイル start /min /wait cmd /c chcp.com 65000 ^& cmd /c type %1 ^>%2 UTF-8.cmd Unicodeファイル UTF-8ファイル start /min /wait cmd /c chcp.com 65001 ^& cmd /c type %1 ^>%2 JIS.cmd Unicodeファイル JISファイル start /min /wait cmd /c ch

                                                                                cmd.exeとchcp.comだけで、文字コード(Unicode、UTF-8、UTF-7、JIS、EUC-JP、SJIS)を変換する! - Windows Script Programming
                                                                              • 栗田穣崇さん『ドコモの絵文字にうんちを入れたかったのですが、社内で大反対されまして…』 うんちの絵文字がUnicodeに登録されるまでの裏話

                                                                                くりたしげたか(Re)🌰ニコニコ代表の人🎊ニコニコ15周年 @sigekun 私がドコモの絵文字に入れたかったのは「💩」うんちの絵文字なのですが、「ドコモが💩はけしからん」と社内で大反対されまして、どうしても実現しませんでした。絶対人気の絵文字になると思っていたのに。今の💩はKDDIさんが実装してくれたおかげで実現しています。#平成ネット史 #emoji 2019-01-04 00:55:11 くりたしげたか(Re)🌰ニコニコ代表の人🎊ニコニコ15周年 @sigekun 💩の絵文字が世界中で使えるのも、Google JapanのGmailプロジェクトマネージャーの岸本さんが「うんちという日本語は幸運を意味する運気と音がよく似ており縁起がいいものであり、日本の文化です」という大ボラで、Unicodeコンソーシアムに強引にねじ込んでくれたからです。感謝。#平成ネット史 #emo

                                                                                  栗田穣崇さん『ドコモの絵文字にうんちを入れたかったのですが、社内で大反対されまして…』 うんちの絵文字がUnicodeに登録されるまでの裏話
                                                                                • 【第511回】UnicodeじゃなくてUTF-8にしてください!? : イジハピ!

                                                                                  2014年01月13日18:08 【第511回】UnicodeじゃなくてUTF-8にしてください!? カテゴリ文字コード【プチ】研究 query1000 Comment(0)Trackback(0) このブログは、FacebookやTwitterへのボタンを配備するために、zenbackのサービスを使っている。 zenbackを使うと面白いのが、記事の題名や内容から類推して、他の人がポストした似たような記事を引っ張ってリスト化してくれることだ。 先週の月曜日、「Unicodeを使うと犯罪ですか」というブログを書くと、「似たような記事」リストの中に、「UnicodeとUTF-8の違い」という記事があった。 これもコンピューターを商売にしてるこっちにしたら、なかなかインパクトのある言葉である。 でも、専門外の人が知らないのはしょうがないと思う。 ぼくもよく知らない分野について相当トンチンカンな

                                                                                    【第511回】UnicodeじゃなくてUTF-8にしてください!? : イジハピ!