likkのブックマーク / 2007年11月28日

likk id:likk

2007年11月28日のブックマーク (2件)

perl - 文字列ばらしはsplit //, $strで : 404 Blog Not Found
2007年11月27日13:30 カテゴリLightweight Languages perl - 文字列ばらしはsplit //, $strでうーん、ここがあきまへん。 [を] 転置インデックスによる検索システムを作ってみよう！ 9 my @char = ($c =~ /([\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]| 10 [\xE0-\xEF][\x80-\xBF]{2}| 11 [\xF0-\xF7][\x80-\xBF]{3})/gsx); 文字列をばらして(utf8の)文字一つ一つの配列にするには、バイト列に正規表現をかますのではなく、utf8文字列にしてからそれにsplit //をかますのが一番です。単にわかりやすいだけではなく、その方がずっと高速です。以下、Benchmark。 #!/usr/local/bin/perl use strict; u
likk 2007/11/28
split //, $str で1utf8文字ずつ分解

Perl

utf-8
リンク
Term::ReadLineが結構楽しい - マツモブログ
CPAN.pmを何気なく見ていたらTerm::ReadLineなるものを発見。恥ずかしながら初見でしたが何やら楽しげなパッケージ名なので遊んでみました。名付けて対話型武藤。まず結果からご覧いただきましょう $ ./muto.pl 武藤 : 武藤 : name 武藤敬司武藤 : kana ムトウケイジ武藤 : height 188cm 武藤 : weight 115kg 武藤 : finishing_move シャイニング・ウィザード武藤 : movie 光る女武藤 : music HOLD OUT 武藤 : 武藤 : 武藤 : all .-------------------------------------------------------. | column | value | +----------------+-------------------------
likk 2007/11/28
Term::ReadLine;Text::ASCIITable

Perl
リンク
- 2008年1月9日
- 2007年11月28日
- 2007年11月27日