タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

utf-8に関するa_666666のブックマーク (1)

  • UTF-8文字列をバイト数でカットした時の末尾の処理 - 徒書

    ……を先日考えていたところ、NiAOUさんよりサンプルスクリプトを提示して頂きましたが、面白そうなので自分でも他のやり方がないか考えてみました(Perlクイズばりに)。 # hint: uft-8 の一文字の正規表現 # [\x00-\x7F]| # [\xC0-\xDF][\x80-\xBF]| # [\xE0-\xEF][\x80-\xBF][\x80-\xBF]| # [\xF0-\xF7][\x80-\xBF][\x80-\xBF][\x80-\xBF]| # [\xF8-\xFB][\x80-\xBF][\x80-\xBF][\x80-\xBF][\x80-\xBF]| # [\xFC-\xFD][\x80-\xBF][\x80-\xBF][\x80-\xBF][\x80-\xBF][\x80-\xBF] 実のところ知りたかったのはこの部分で、最高何バイトまであり得るのかとか、各

  • 1