自分の頭を整理するために書いておく。正しいかは知らない。 まず前提として、Javaの内部表現としての「文字」は16ビット長のUTF-16ということがある。そうすると、普通に長さを取得すると、UTF-16のサロゲートペアで表される文字は2文字と扱われる。 また、文字には合成済み文字という話がある。「か」の後に濁点を結合することで、「が」を表現するみたいなやつ。 これらから、どこまで考慮して文字列の長さを取得するかでやり方が違う。 UTF-16のサロゲートペアを考慮しない UTF-16のサロゲートペアを考慮する 合成済み文字を考慮する 以下試したサンプルコード。 import java.text.BreakIterator; public class UnicodeCharSample { public static void main(String[] args) { // 𪛀あが St
はじめに 今回はUSBについて解説する。Universal Serial Busの頭文字を並べたUSBは、自由に抜き差しが可能な有線接続の通信インタフェースとしてだけでなく、スマートフォンなどの小型電子機器への電源供給手段として最も身近なインタフェースだろう。そんな手軽で便利で身近なみんな大好きUSBだが、実際にはかなりややこしい存在なのだ。今回はそんなお話である。 ややこしいその1 巨大すぎる規格 USBの規格はUSB Implementers Forum, Inc.(USB-IF)という業界団体が策定し公開している。現在USB-IFから取得できる主な規格書は、以下のようなものだ。 Universal Serial Bus Revision 3.1 Specification Universal Serial Bus Revision 2.0 Specification Wireless
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く