CockroachDB はどのくらい「しぶとい」のか? / How tough is CockroachDB?
CockroachDB はどのくらい「しぶとい」のか? / How tough is CockroachDB?
CONTENTS NAME DESCRIPTION Important Caveats Byte and Character Semantics ASCII Rules versus Unicode Rules Extended Grapheme Clusters (Logical characters) Unicode Character Properties General_Category Bidirectional Character Types Scripts Use of the "Is" Prefix Blocks Other Properties Comparison of \N{...} and \p{name=...} Wildcards in Property Values User-Defined Character Properties User-Defined
みなさん、ワンライナーで日本語を簡単に処理したい場合、何を使うでしょうか。 ワンライナーで言語処理といえばPerlですよね[要出展]。 Perlでは、「ひらがな」「カタカナ」「漢字」といった文字にマッチする正規表現を簡単に書くことができます。 例えば、青春→鯖鰆みたいなやつという記事では、漢字にマッチさせるのに\p{Han}という正規表現を使っていました。 $ perl -Mutf8 -CSD -le 'print "漢" =~ m{\p{Han}} ? 1 : 0' 1 $ perl -Mutf8 -CSD -le 'print 1 if "あ" =~ m{\p{Han}} ? 1 : 0' 0 なんてこった。 "「"は明らかに漢字じゃないだろう? 調べてみると、perlunicodeに以下のような記述がありました。 Prior to Perl v5.26, the single for
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く