文字列を処理するのに Python はとても便利ですが,速度が気になる状況では,やはり C/C++ を使いたいところです.ということで,Unicode 正規化(http://homepage1.nifty.com/nomenclator/unicode/normalization.htm)のために ICU(ICU - International Components for Unicode)を試してみました. インストール Synaptic パッケージ・マネージャから libicu-dev をインストールできました. Unicode 正規化のテスト // g++ には `icu-config --cppflags --ldflags` を渡します. #include <unicode/normlzr.h> #include <iostream> int main() { // utf-8