タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

programmingとProgrammingとregexpに関するockeghemのブックマーク (3)

  • 2006-12-13

    評伝シャア・アズナブル 《赤い彗星》の軌跡 下巻 (KCピ-ス) 作者: 皆川ゆか出版社/メーカー: 講談社発売日: 2006/12/07メディア: 新書購入: 5人 クリック: 43回この商品を含むブログ (92件) を見る 読破!当に他人事とは思えないぜ。。。 っていうか、Amazonランキングで20位台って初めて見た。(w まずは、この辺(1・2・3・4・5)を参照してもらった上で、どうしてこうなっているのか説明をしたいと思います。 書こうと思ったキッカケはオレンジニュースで掲載されていたので。 参照して頂ければ(参照しなくても)分かると思いますが、PHP4系統ではマルチバイト対応正規表現関数(mb_ereg系)はUTF-8の文字列を正しく処理できませんが、PHP5系統では正しく処理できます。 理由は簡単で、PHP4系統とPHP5系統ではマルチバイト対応正規表現ライブラリの実装が全

    2006-12-13
    ockeghem
    ockeghem 2009/03/15
    mb_eregがUTF-8をうまく扱えないのは、PHP4の話なのですね。まぁそうだろうな
  • 「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う:phpspot開発日誌

    Information Flow and Stock: [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ! なので、できる限りpreg系の関数を使いたいわけですが、検索対象や検索パターンに日語が含まれているときは、日語処理に対応したereg系の関数であるmb_ereg系の関数が使われることが多いようです。 以前、「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う方法。 以前はmb_eregによる方法を示しましたが、次の方法の方がうまく動作するようです。 preg_match_all('/[一-龠]+|[ぁ-ん]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+/u', $strToSplit, $aMatches); print_r($aMatches); // マッチ結果が全出力 確かに、なぜか取れない漢字があ

  • [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ!

    ウノウラボ Unoh Labs: PHPのちょっとしたコツ  最近のスクリプト言語は機能が多く、基的な機能はほとんど実装されているので、アルゴリズムをどうこうするより、どの機能を使うか選ぶ方が重要だったりしますね(コーディングの効率的にも)。  自分にもそういったレベルで気をつけていることがいくつかあります。 -[早起き生活]PHPのパフォーマンスチューニング -[早起き生活]PHPのパフォーマンスチューニング その2:count()も使い過ぎると重くなる -[早起き生活]PHPのパフォーマンスチューニング その3:APC投入  あと、最近気づいたTIPSとしては、 日語を正規表現検索したいときでもereg系の関数を使うのはやめとけ なんてのもあります。  PHPの組み込み正規表現関数にはPHP独自のereg系とPerl互換のpreg系がありますが、ヘルプに書いてあるとおり、ereg系

  • 1