タグ

2007年11月28日のブックマーク (2件)

  • perl - 文字列ばらしはsplit //, $strで : 404 Blog Not Found

    2007年11月27日13:30 カテゴリLightweight Languages perl - 文字列ばらしはsplit //, $strで うーん、ここがあきまへん。 [を] 転置インデックスによる検索システムを作ってみよう! 9 my @char = ($c =~ /([\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]| 10 [\xE0-\xEF][\x80-\xBF]{2}| 11 [\xF0-\xF7][\x80-\xBF]{3})/gsx); 文字列をばらして(utf8の)文字一つ一つの配列にするには、バイト列に正規表現をかますのではなく、utf8文字列にしてからそれにsplit //をかますのが一番です。単にわかりやすいだけではなく、その方がずっと高速です。以下、Benchmark。 #!/usr/local/bin/perl use strict; u

    perl - 文字列ばらしはsplit //, $strで : 404 Blog Not Found
    likk
    likk 2007/11/28
    split //, $str で1utf8文字ずつ分解
  • Term::ReadLineが結構楽しい - マツモブログ

    CPAN.pmを何気なく見ていたらTerm::ReadLineなるものを発見。 恥ずかしながら初見でしたが何やら楽しげなパッケージ名なので遊んでみました。 名付けて対話型武藤。 まず結果からご覧いただきましょう $ ./muto.pl 武藤 : 武藤 : name 武藤 敬司 武藤 : kana ムトウ ケイジ 武藤 : height 188cm 武藤 : weight 115kg 武藤 : finishing_move シャイニング・ウィザード 武藤 : movie 光る女 武藤 : music HOLD OUT 武藤 : 武藤 : 武藤 : all .-------------------------------------------------------. | column | value | +----------------+-------------------------

    Term::ReadLineが結構楽しい - マツモブログ
    likk
    likk 2007/11/28
    Term::ReadLine;Text::ASCIITable