タグ

regexとphpに関するhiro_yのブックマーク (5)

  • 正規表現講習会(その1)を開催しました

    社内勉強会として、正規表現について喋ってみました。「最長一致」をテーマに、正規表現マッチのイメージが湧いていない人にもわかるような内容を目指したつもりですが、POSIXとPCREの最長一致の違いなど、ややマニアックな内容も含んでいます。 第29回PHP勉強会でも似た内容で発表させてもらいましたが、実はこの社内勉強会のプレゼンの一部を取り出して紹介したものでした。 今回のムービーはzoomeにアップロードしてみました。アップロードされている他のムービーと見比べると異色な内容のような気がしますが、ありがたく使わせて頂きます。 ムービー 発表資料 スライド(PDF) 補足1: 「最短一致は使わない」について 基的に最短一致は使うな、という結論にしてしまっているのですが、これは説明を端折っている面が大きいです。私の考えでは、正規表現初心者の頃は特にそうなのですが、「マッチングが最長一致であるため

    hiro_y
    hiro_y 2008/02/03
    PHPの正規表現。
  • 第29回PHP勉強会に行ってきました - hnwの日記

    1週間経ってしまいましたけど、先週23日に第29回PHP勉強会に行ってきました。勉強会の会場はトライコーン株式会社さんにお貸し頂きました。ありがとうございます。 今回は久々に僕も発表させてもらいました。発表資料を公開しておきます。 「PHPの正規表現と最長一致」 僕は少し前に社内勉強会で30分ほど正規表現ネタの話をしたのですが、濃い部分を抜き出して再構成したのが今回のプレゼンです。 一口に最長一致と言っても2種類ある、というのは大半の人にとって意外なことなのではないでしょうか。PHPは正規表現マッチの関数が大別して2系統あり、両者でマッチングの結果が変わる事もある、というのはPHP特有の面白い話かと思います。 他の発表についてですが、id:yandodさんの発表は楽しかったのですが、自分が最近発表していないことがわかってショックでした。実は6月に短い話をしているんですが、資料には名前が挙っ

    第29回PHP勉強会に行ってきました - hnwの日記
    hiro_y
    hiro_y 2008/01/01
    PHPの最長マッチについて。greedy matching/longest matching。
  • [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ!

    ウノウラボ Unoh Labs: PHPのちょっとしたコツ  最近のスクリプト言語は機能が多く、基的な機能はほとんど実装されているので、アルゴリズムをどうこうするより、どの機能を使うか選ぶ方が重要だったりしますね(コーディングの効率的にも)。  自分にもそういったレベルで気をつけていることがいくつかあります。 -[早起き生活]PHPのパフォーマンスチューニング -[早起き生活]PHPのパフォーマンスチューニング その2:count()も使い過ぎると重くなる -[早起き生活]PHPのパフォーマンスチューニング その3:APC投入  あと、最近気づいたTIPSとしては、 日語を正規表現検索したいときでもereg系の関数を使うのはやめとけ なんてのもあります。  PHPの組み込み正規表現関数にはPHP独自のereg系とPerl互換のpreg系がありますが、ヘルプに書いてあるとおり、ereg系

    hiro_y
    hiro_y 2006/10/28
    UTF-8の正規表現、preg系の関数、パターン修飾子「/u」。
  • AJAX Reguler EXpression eValuator

    EnglishBulgarian

    hiro_y
    hiro_y 2006/01/30
    PHP、JavaScriptに対応した正規表現チェッカー。
  • 「すべての漢字を取り出す正規表現」をPHPで試す:phpspot開発日誌

    すべての漢字を取り出す正規表現を参考にPHPでトークンを切り出すサンプルを作成しました。 <?php // スクリプトはUTF-8で記述されています $str = <<<EOM ようこそphpspotへ!当サイトではフリーのwindowsphp開発環境であるPHPエディタ forWin や、フリーのPHPスクリプト( PHP掲示板,webshot,webimager,CMS 等 )、PHPツールバー、テレビバー、便利検索バー(Yahoo,Google,辞典検索)などを配布しています。その他、PHP入門 や PHP5ーTIPS、PHPサンプル集、MySQL解説、PHPレンタルサーバー特集などのコーナーもあります。 EOM; mb_internal_encoding("UTF-8"); mb_regex_encoding("UTF-8"); $token = array(); // すべての

    hiro_y
    hiro_y 2005/11/07
    mb_eregを使って形態素解析。何かに使えそうな。
  • 1