タグ

regexpに関するcx20のブックマーク (4)

  • 複数のhtmlファイル内の文字列を一括置換を考えています。…

    複数のhtmlファイル内の文字列を一括置換を考えています。 検索文字列のパターン(例) 1.<body bgcolor=”#ffffff” MARGINWIDTH=”0” MARGINHEIGHT=”0” LEFTMARGIN=”0” TOPMARGIN=”0”> 2.<body> 3.<body bgcolor=”#cccccc”> 置換え後の文字列 1.<body bgcolor=”#ffffff” MARGINWIDTH=”0” MARGINHEIGHT=”0” LEFTMARGIN=”0” TOPMARGIN=”0”><div align=”center”>xxx</div> 2.<body><div align=”center”>xxx</div> 3.<body bgcolor=”#cccccc”><div align=”center”>xxx</div> というような、感じに

    cx20
    cx20 2006/01/28
    WZ の例:「(\<body.*\>)」→「\1<div align="center">xxx</div>」
  • Diary of 2005/11/22

    2005/11/22 火曜日 なんでもかんでもExcel症候群 何でもかんでもPowerPoint症候群の弊害を日記で書いたのだが、それよりも世の中に広く広まっている病的な物と言えば、なんでもかんでもExcel症候群であろう。とにかく通常の表だけに飽きたらず、提出書類から報告書まで何でもかんでもExcelなのである。つまり「何でもかんでもExcel症候群」とはExcelだけですべての仕事が完結してしまう恐ろしい病気なのだ。 その病巣の由来を簡単に予想するとすれば、子供の頃に升目の入ったノートで漢字の書き取りをやらされ(つまりカーニングとかに無頓着になる)、読書感想文などの類は原稿用紙で書かされ、漢字は少ない文字数で情報量を詰め込めることからすっきりとした表が書きやすく、何でもかんでも表にしないと気が済まないという日人の悲しい習性に由来する物であろうと思うのだ。 まぁUnixでEmacsし

    cx20
    cx20 2005/11/29
    ADO とかも使い方を覚えると色々便利。Excel をデータソースにして SQL 発行したりとか。
  • すべての漢字を取り出す正規表現 - totonのブログ

    http://www.unixuser.org/~euske/doc/python/sample.py.html # 日語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html [亜-煕]はJIS漢字を検出するときに使う正規表現になります。 文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので,すべての漢字を検出するには,[一-龠]を使用してください(龠は音読みで「ヤク」,訓読みで「ふえ」,Unicodeでは「9FA0」にあたります)。 追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。

    すべての漢字を取り出す正規表現 - totonのブログ
    cx20
    cx20 2005/11/05
    龠 λλλλλ....サザエサーンハ ユカイダナー
  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • 1