タグ

progとunicodeに関するrnaのブックマーク (12)

  • pͪoͣnͬpͣoͥnͭpͣa͡inͥを支える技術 - Qiita

    pͪoͣnͬpͣoͥnͭpͣa͡inͥの作り方 ぽんぽんぺいんを簡単に作るサイトを作ったのでよかったら使ってみてください。 【ここをクリック】 ponponpain(haraita-i)とは 画像でいうとこんなやつのこと。 今回参考にさせていただきましたが、以下のサイトによくまとまっていると思います。 不思議な文字 pͪoͣnͬpͣoͥnͭpͣa͡inͥ | bison's brain at postachio ぽんぽんぺいん ‐ 通信用語の基礎知識 まあ要するに、不思議な上付き文字を組み合わせて、文字に副題(ルビ)をふろうって感じの遊びのことで、昔流行ったみたいです。 今回はクリックだけで上付き文字を加えられるサイトを作ったのでぜひみんなに遊んでほしいなと思っています。 投稿について UbuntuのChromeだと綺麗に表示されないのですが、Twitterだといい感じになるみたいです。

    pͪoͣnͬpͣoͥnͭpͣa͡inͥを支える技術 - Qiita
  • Unicodeの大文字と小文字のまとめ | hydroculのメモ

    Unicodeの大文字と小文字のまとめ 2014/11/09 Unicodeには、大文字小文字を変換するためのルールがUnicodeの仕様として定められている。 下の表は、それを一覧にしたもので、一番左の列が元の文字で 2列目から4列目は小文字・タイトル文字・大文字に変換したときの文字を示している。 英語で使われるアルファベット26文字しか考えないとルールは非常にシンプルでいいのだが、多言語対応しようと思うと、以下の表に基づく必要がある。 中にはドイツ語の”ß“のように2文字以上に変換されるものもある。 「タイトル文字」(Title case letter)というのは、1文字目を大文字・2文字目以降を小文字にしたときに使われる文字である。26文字しか考える必要がない場合は、このタイトル文字という概念も不要で、単にそのまま1文字目を大文字にして、2文字目以降を小文字にすればよい。しかし、Un

  • utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる

    RailsMySQLのcollationをサーバー側のデフォルトのutf8_general_ciからutf8_unicode_ciにわざわざ変えてるのどうせ大した理由じゃないだろと思って掘ってみたらやっぱり大した理由じゃなかった… https://t.co/6NeetGhTF0— Ryuta Kamizono (@kamipo) April 18, 2014 Railsでcollationとしてutf8_unicode_ci(RailsのDEFAULT_COLLATION)が採用されるのはcharsetが未指定もしくはutf8(RailsのDEFAULT_CHARSET)のときだけで、utf8mb4にすることとかは全く考慮されてない。— Ryuta Kamizono (@kamipo) April 19, 2014 @frsyuki MySQLのcharset utf8のときのデフォルト

    utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる
    rna
    rna 2015/03/08
    「utf8_unicode_ciでは'ハ'と'パ'は等価と扱われるので'ハハ'も検索に引っかかります。" "SELECT * FROM families WHERE relationship = 'パパ';」
  • Lionにナマハゲと天狗が入っているのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Appleカラー絵文字って何? iPhoneやLionに搭載されている絵文字フォントの名前だよ。Lionをインストールすると、iPhoneのカラー絵文字Macでも使えるようになるんだ。文字ビューアの「絵文字」から入力できるよ。 iPhoneとLionでは、絵文字に違いはあるの? いちばん目立つ違いは、Lionでは文字が増えてることかな。 わあ、どんなのが増えたの? ナマハゲとか天狗とかナルトとか。 これ、モノクロじゃん。 増えてるぶんは、ぜんぶモノクロ。Lionは、Unicodeに収録されたケータイ絵文字のうち、Softbank絵文字以外を、いわば「docomo/au互換絵文字」としてモノクロでサポートしている*1。このモノクロの絵文字は、文字ビューアの「絵文字」には表示されない。Font Bookでレパートリーを表示すると、下のほうに入ってるよ。 Gmailを使えば、以前からMacでも

    Lionにナマハゲと天狗が入っているのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    rna
    rna 2011/07/28
    うわぁ
  • 覚えるテク| [Java]サロゲートペア文字列の操作

    目的 Vistaが世に出てから、サロゲートペア文字列の扱いに頭を悩ませているエンジニアの方々も多いと思うのですが、「java サロゲートペア substring」とかで検索しても、なぜかそれっぽい記事が出てきません。 毎回実装するたび忘れて再実装しちゃうので、作ったクラスをメモしときます。 (もしかして、汎用的なUtilityとかあるのか?) ソース public final class CodePointUtils { private CodePointUtils() { } /** * サロゲートペア文字を置換. * * @param str * 文字列 * @param replacement * 置換文字列 * @return 置換後文字列 */ public static String replaceSurrogatePair(String str, String replace

  • Vistaで化ける字,化けない字

    11月30日に企業向けには出荷が始まったWindows Vista。そのVistaで,“文字化け”が起こるらしい。文字化けといっても,Webアクセス中にたまに見かける全く読めない文字の羅列になることはほとんどなく,その多くは似た文字が表示される程度である。ここでは,来表示されるべき文字の形が少し違ったものが表示されるケースも“文字化け”として扱う。 Microsoftは,Windows 98日語版の発売以来,Windows 2000,Windows Me,Windows XPまでCP932(名はWindows Codepage 932,いわゆるMS漢字コード)とJIS X 0212をサポートしてきたが,最新のWindows VistaではJIS X 0213に乗り換えた。いや,乗り換えたというのは,ちょっと語弊がある。CP932とJIS X 0212に加えて,JIS X 0213もサ

    Vistaで化ける字,化けない字
  • Unicodeの似た文字を整理してみた - y-kawazの日記

    XMLやCSV等のデータをJavaで色々加工して出力したりといったことをしてると必ずハマるのが波線などの文字化け問題です。 文字化けが発覚するたびにググって場当たり的な対処を繰り返すのに疲れたのでよく問題になる文字と形が似た文字をリストアップして、更にそれをJavaで各種エンコーディングに変換したらどの文字になるかを頑張って纏めました。 ついでに文字化けしないよう上手いこと出力可能な文字に置換する関数も作ってみました。 Javaの変換テーブル 表中の U,S,W,E,J はそれぞれ、UTF-8、Shift_JIS、Windows-31J、EUC-JP、ISO-2022-JP で出力した際の文字です。 見た目で分からないくらい似た文字ばかりなので、各セルにマウスカーソルを乗せたらツールチップで確認できるようtitleにコードポイントを書いておきました。 分かりやすいよう、青は文字化けなし、黄

    Unicodeの似た文字を整理してみた - y-kawazの日記
  • GT Nitro: カーレーシング・ドラッグレーシングゲーム - Google Play のアプリ

    GT Nitro: Car Game Drag Raceは、典型的なカーゲームではありません。これはスピード、パワー、スキル全開のカーレースゲームです。ブレーキは忘れて、これはドラッグレース、ベイビー!古典的なクラシックから未来的なビーストまで、最もクールで速い車とカーレースできます。スティックシフトをマスターし、ニトロを賢く使って競争を打ち破る必要があります。このカーレースゲームはそのリアルな物理学と素晴らしいグラフィックスであなたの心を爆発させます。これまでプレイしたことのないようなものです。 GT Nitroは、リフレックスとタイミングを試すカーレースゲームです。正しい瞬間にギアをシフトし、ガスを思い切り踏む必要があります。また、大物たちと競いつつ、車のチューニングとアップグレードも行わなければなりません。世界中で最高のドライバーと車とカーレースに挑むことになり、ドラッグレースの王冠

    GT Nitro: カーレーシング・ドラッグレーシングゲーム - Google Play のアプリ
  • Unicode正規化

    正しい並び替えでは、表示は(A)のままですが、間違った並び替えでは、正規結合クラスが互いに等しいMACRONとACUTEを並び替えたため、表示は(B)のように、eの上のアクセント記号の位置が入れ替わってしまいます。 正規分解・互換分解 ある文字列の正規分解 (Canonical Decomposition) を得るには、まず、それぞれの文字を正規マッピングによって再帰的に、可能な限り、分解します。すなわち、1回分解した後に現れた文字がなおも分解可能であればさらに分解します。分解マッピングがその文字自身である場合は、分解不可能なので、そのままです。 しかし、分解しただけでは必ずしも正しい結果が得られません。つまり、結合文字の順序の一意性を保証するため、分解後の文字列に対して正規順序アルゴリズムを適用しなければなりません。このように、正規マッピングによる再帰的分解と、正規順序アルゴリズムによ

  • UTF-8-MAC - MacWiki

    UTF-8-MAC とは[編集] UTF-8-MAC とは、Mac OS X に付属する iconv にて利用できる文字エンコードの一つで、 Normalization Form D (NFD) で符号化した UTF-8 のことを指します。 一般に UTF-8 とだけいった場合には、Normalization Form C (NFC) でエンコードされたものを意味します。 Unicode 標準では、NFC は正規結合(Canonical Composition)、 NFD は正規分解(Canonical Decomposition)として規定されています。 たとえば、「が」の字を NFC で表現すると U+304C (HIRAGANA LETTER GA) ですが、 NFD では U+304B U+3099 (HIRAGANA LETTER KA + COMBINING KATAKANA-

    rna
    rna 2010/01/29
    SMBの共有名がコレで化けることがある。
  • Table for Working Draft Proposal for Encoding Emoji Symbols

    The images in this file point to images on other sites. The images are only for comparison and may change. See the chart legend for an explanation of the data presentation in this chart. Symbol ID Symbol Name & Annotations DoCoMo KDDI SoftBank Google

  • Twitter新携帯サイト公開 絵文字OK ドコモ端末対応

    デジタルガレージと米Twitterは10月15日、日の携帯電話に特化した「Twitter」公式サイト「http://twtr.jp/」を公開した。モバイル版Twitterガイドサイト「ツイナビモバイル」β版も同時に公開した。 従来のサイトをリニューアル。携帯電話に最適化したユーザーインタフェースにしたほか、新たに、絵文字の投稿・表示に対応。ダイレクトメッセージ(DM)にも対応した。 自己紹介やアイコン画像などユーザー情報の変更も可能に。au、ソフトバンクモバイルに加え、NTTドコモ端末からも利用できるようになった。 両社が今年前半に行った調査では、Twitterを携帯電話から利用しているユーザーが95%に達したという。今後、携帯電話からユーザー登録できる機能など、機能を順次追加していく予定だ。

    Twitter新携帯サイト公開 絵文字OK ドコモ端末対応
    rna
    rna 2009/10/15
    「絵文字の投稿・表示に対応」絵文字をつぶやくとPCでは http://tinyurl.com/67owjf の Google 版外字コードで表示される。PCからUnicode文字参照でつぶやいても携帯には絵文字は出ない(ソースが表示される)。絵文字コピペなら出る。
  • 1