[B! programming][Programming][regexp] ockeghemのブックマーク

ockeghem id:ockeghem

programmingとProgrammingとregexpに関するockeghemのブックマーク (3)

2006-12-13
評伝シャア・アズナブル《赤い彗星》の軌跡下巻 (KCピ-ス) 作者: 皆川ゆか出版社/メーカー: 講談社発売日: 2006/12/07メディア: 新書購入: 5人クリック: 43回この商品を含むブログ (92件) を見る読破！本当に他人事とは思えないぜ。。。っていうか、Amazon ランキングで20位台って初めて見た。（ｗまずは、この辺（１・２・３・４・５）を参照してもらった上で、どうしてこうなっているのか説明をしたいと思います。書こうと思ったキッカケはオレンジニュースで掲載されていたので。参照して頂ければ（参照しなくても）分かると思いますが、PHP4系統ではマルチバイト対応正規表現関数（mb_ereg系）はUTF-8の文字列を正しく処理できませんが、PHP5系統では正しく処理できます。理由は簡単で、PHP4系統とPHP5系統ではマルチバイト対応正規表現ライブラリの実装が全
ockeghem 2009/03/15
mb_eregがUTF-8をうまく扱えないのは、PHP4の話なのですね。まぁそうだろうな

php

regexp

programming
リンク
「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う:phpspot開発日誌
Information Flow and Stock: [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ！なので、できる限りpreg系の関数を使いたいわけですが、検索対象や検索パターンに日本語が含まれているときは、日本語処理に対応したereg系の関数であるmb_ereg系の関数が使われることが多いようです。以前、「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う方法。以前はmb_eregによる方法を示しましたが、次の方法の方がうまく動作するようです。 preg_match_all('/[一-龠]+|[ぁ-ん]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[ａ-ｚＡ-Ｚ０-９]+/u', $strToSplit, $aMatches); print_r($aMatches); // マッチ結果が全出力確かに、なぜか取れない漢字があ
ockeghem 2009/03/15
programming

php

regexp
リンク
[PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ！
ウノウラボ Unoh Labs: PHPのちょっとしたコツ　最近のスクリプト言語は機能が多く、基本的な機能はほとんど実装されているので、アルゴリズムをどうこうするより、どの機能を使うか選ぶ方が重要だったりしますね（コーディングの効率的にも）。　自分にもそういったレベルで気をつけていることがいくつかあります。 -［早起き生活］PHPのパフォーマンスチューニング -［早起き生活］PHPのパフォーマンスチューニングその2：count()も使い過ぎると重くなる -［早起き生活］PHPのパフォーマンスチューニングその3：APC投入　あと、最近気づいたTIPSとしては、日本語を正規表現検索したいときでもereg系の関数を使うのはやめとけなんてのもあります。　PHPの組み込み正規表現関数にはPHP独自のereg系とPerl互換のpreg系がありますが、ヘルプに書いてあるとおり、ereg系
ockeghem 2009/03/15
programming

php

regexp
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx