タグ

unicodeに関するo_tiのブックマーク (5)

  • Unicode 文字テーブル - すべての Unicode 記号とそのコードを 1 ページに掲載 (◕‿◕) SYMBL

    「矢印、数学記号、絵文字、象形文字、古代の文字を含む、約50万種類の記号が利用可能です。各記号はテーブル内で指定されたセルに配置されています。ユニコード文字の多種多様なバリエーションを探るためには、下にスクロールしてご覧ください。または、右側のブロックナビゲーションを使うと、各文字ブロックがテーブル内で17の面に分けて範囲を占める様子を確認できます。例えば 🜋 錬金術記号 を試してみてください。気に入った文字にマウスオーバーをするとその名前が表示されるか、それをコピーできます。記号の名前をクリックすると、それを研究するための別のページに進むことができます。」

    Unicode 文字テーブル - すべての Unicode 記号とそのコードを 1 ページに掲載 (◕‿◕) SYMBL
  • Unicodeの似た文字を整理してみた - y-kawazの日記

    XMLやCSV等のデータをJavaで色々加工して出力したりといったことをしてると必ずハマるのが波線などの文字化け問題です。 文字化けが発覚するたびにググって場当たり的な対処を繰り返すのに疲れたのでよく問題になる文字と形が似た文字をリストアップして、更にそれをJavaで各種エンコーディングに変換したらどの文字になるかを頑張って纏めました。 ついでに文字化けしないよう上手いこと出力可能な文字に置換する関数も作ってみました。 Javaの変換テーブル 表中の U,S,W,E,J はそれぞれ、UTF-8、Shift_JIS、Windows-31J、EUC-JP、ISO-2022-JP で出力した際の文字です。 見た目で分からないくらい似た文字ばかりなので、各セルにマウスカーソルを乗せたらツールチップで確認できるようtitleにコードポイントを書いておきました。 分かりやすいよう、青は文字化けなし、黄

    Unicodeの似た文字を整理してみた - y-kawazの日記
  • なぜ絵文字を含む文字を1文字ずつに分けるのにArray.fromだけで十分なのか? - Qiita

    「Node.js で絵文字を使う時の注意点 - Qiita」にコメントしたのですが、大雑把すぎて説明になっていない気がするので、詳細に解説したいと思います。 TL;DR 絵文字のようなサロゲートペアを含む文字列をJavaScriptで扱おうとすると面倒。 ↑ s.length、s[0] とか s.split('') とかがおかしくなる。 1文字ずつに分割したいときは Array.from が使える。 なぜなら、Array.from は内部的に for of 文のようなことをしていて、文字列に対する for of はサロゲートペアを考慮するから。 問題点と解決まで 絵文字を含む文字、つまりUTF-16のサロゲートペアを含むような文字を一文字ずつに分割したい場合、JavaScriptでは問題が生じます。つまり、どういうことかというと、 const kira = 'キラッ🌠' // 見ため上は

    なぜ絵文字を含む文字を1文字ずつに分けるのにArray.fromだけで十分なのか? - Qiita
  • [JavaScript] サロゲート・ペアに対応した文字列操作関数を書いてみた / LiosK-free Blog

    2008-11-06 カテゴリ: Client Side タグ: JavaScript 安易な発想 Unicode JavaScriptの文字列型はUTF-16を採用しているから、サロゲートペアを使用した文字が混ざるといろいろと厄介だったりする。一例としては↓のような感じ。 var s = "𪚲"; // U+2A6B2 console.log(s.length); // 2 console.log(s.split("")); // ["�", "�"] ということで、サロゲートペアの扱いを少し楽にする関数を書いてみたからとりあえず公開してみる。 /** 文字列中にサロゲートペアを含む場合はtrue */ String.prototype.hasSurrogate = function() { return (/[\uD800-\uDBFF][\uDC00-\uDFFF]/).test(

  • naoki_OSX Wiki*

    Macの使い方を文章に残したいとき、「⌘ + C」を操作するのを「コマンド+C」などと書いたりします。ちょっとかっこわるいし、直感的に分かるように、⌘ と書きたいと思いました。調べてみました。 記号を入力したいときは、まず、各アプリケーションのエディットメニュー (Edit) > 特殊文字 (Special Character...) を選択して文字ビューア (character viewer) を呼び出します。(ATOK でも同様に出来ます) 出てきたビューア、右上の検索フィールドへ下表にある文字(シンボル)のUnicode コードを入力して、望みの文字を表示して、ダブルクリックで確定(Unicode に対応しているアプリのみ) 例えば、リターン(キー)のシンボルを得るには、検索フィールドに 0x23ce として検索すれば、文字が出て、ダブルクリック。 HTML に埋め込みたいときは、&

    naoki_OSX Wiki*
  • 1