タグ

正規表現に関するmorobitokozouのブックマーク (26)

  • りょうくんグルメの文体を自動でもとに戻すやつを作りました - 開け閉め

    りょうくんグルメをご存知だろうか。知らなくても、人のツイートの雰囲気は料理レシピなんかで一度は見た文脈のはずだ。 こんなやつ。 まじでこの世の全てのタピオカ好きに教えてあげたいんだが新宿三丁目のceleb縁味には全ての人間を虜にする禁断のオレオミルクフォームがある。 これが濃厚黒糖で超絶美味いからぜひ全国のタピオカ好き、タピオカを愛する者たち、タピオカを憎む者たち、全てのタピオカ関係者に伝われ pic.twitter.com/wnnPvkJ2pr— りょうくんグルメ (@uryo1112) 2019年6月15日 「りょうくんグルメ」は文章が情報量に対してやたら長いので、pythonの練習も兼ねてアイデンティティである上から目線の構文を取り去ることにした。逆りょうくんグルメである。 手順は大雑把に分けて以下の3ステップ。 1. Twitterからりょうくんグルメのツイートをスクレイピング

    りょうくんグルメの文体を自動でもとに戻すやつを作りました - 開け閉め
  • 【文字コード】SJISで半角カタカナチェックに正規表現を使った際の落とし穴【正規表現】 - 俺のメモ帖

    フォームに、半角カタカナ限定の入力項目をおいて、入力項目チェックを正規表現を使って行った際の落とし穴。 まあこれも知ってる人には何を今更って感じなんだろうけど。 ちゃんと表示されるかわからないんだけど、 「^[ア-ンァ-ッ]*$」とか書いたんだけど、これで半角の「ア」~「ン」、「ァ」~「ョ」、「ッ」がチェックできると思って、全文字入力チェックしたんですよ。 すると、何故か「ヲ」だけチェックをすり抜ける。。。 ※省いてるけど、濁点・半濁点・長音符も含んでました 原因は文字コード表見ると一目瞭然でした。 半角カタカナの文字コード上での並び順が酷い(笑) 誰がこんな並びにしたのか・・・ 見てわかるんだけど、なんで「ヲ」が「ァ」の前にあるの・・・??? 「^[ア-ンヲ-ッ]*$」で解決。ふざけんな。 軽く調べてみたら、以下のような情報が。 oshiete.goo.ne.jp なんか大正時代に山下芳

    【文字コード】SJISで半角カタカナチェックに正規表現を使った際の落とし穴【正規表現】 - 俺のメモ帖
    morobitokozou
    morobitokozou 2018/03/26
    “「ヲ」だけチェックをすり抜ける”
  • 普通のパズルではない「正規表現クロスワード」がBBCラジオに登場

    文章によるヒントを元にタテヨコに交差したマスに言葉を当てはめてマスを埋めていく「クロスワードパズル」のヒント部分を正規表現にした「正規表現クロスワード」なるものがBBCラジオの「Puzzle for Today」(今日のパズル)に登場しました。 BBC Radio 4 - Today - Puzzle for Today http://www.bbc.co.uk/programmes/articles/5LCB3rN2dWLqsmGMy5KYtBf/puzzle-for-today 2017年7月5日の今日のパズルがこれ。クロスワードパズルですが、マスを埋めるためのヒントが正規表現という、一見すると暗号のようになってます。 例えば、0行目の記載は「[^XZVCHFJLQM]+」。正規表現のルールでは、「^」は「それ以外」を、「[]」は「任意の文字」を、「+」が「前の文字の繰り返し」を意味す

    普通のパズルではない「正規表現クロスワード」がBBCラジオに登場
  • おそるべし正規表現 「ある文字列を含まない行」: 大阪のオッサンのダラダラ日記

    日、会社のプロキシサーバの予備機をセットアップしたのです。 番機と同じ設定にすべく作業をしていたのですが、 なにかがおかしい・・・ プロキシサーバには、squidを使っているのですが、 設定ファイルである”squid.conf”はなんと4000行以上もあるのです。 どうやら、同じような記述を何回もしていたり、矛盾する記述をしているようなのです。 で、「どこがおかしいのかいな?」と探してみたもののわけがわからん・・・ コメント行以外を見ていくのですが、4000行以上あるのはちょっと・・・ というわけで、コメント行以外を”grep”で抽出してみることに。 ”squid.conf”のコメント行は、#で始まっているので#を含まない行をみつければOKのはず。 つまり、「ある文字列を含まない行」を探すのです。 というわけで、正規表現を考えたもののなかなかうまくいかず。 悩んだ時の、ネット頼みをして

  • 正規表現の構文

    正規表現は、通常の文字 (a ~ z など) と、"メタキャラクタ" という特殊文字から構成される文字列のパターンです。パターンによって、テキスト文を検索するときに一致する 1 つ以上の文字列を指定します。正規表現は、検索対象の文字列と文字パターンを一致させるためのテンプレートとして機能します。 正規表現の例をいくつか次に示します。 JScript VBScript 一致結果

    正規表現の構文
  • テキスト整形 - MeryWiki

    主な改造点[編集] 拡張コードの書式を変更。 簡易書式をベースに単純化。view フラグは削除。 「関数タイプ」は「オプション」に変更。 処理の戻り値により選択範囲を置換するか、再選択するかを制御できるようにした。 行選択してから処理する際、範囲終端の改行は範囲に含めないようにした(正規表現 ^ $ の使い勝手を考え)。 メソッド String.replaceBatch を追加。 範囲選択時に対象範囲を選ぶメニューを廃止(毎回選ぶのが面倒なため)。 注意点[編集] 表示行での処理には対応していません。 マクロの仕様上、矩形選択での処理には原則対応していません。 お知らせ (2019/06/01)[編集] 仕様変更によりモードは廃止されました。 詳しくは #更新履歴 または 利用者:Masme のページをご覧ください。 旧仕様の利用者はお手数ですが基コードおよび拡張コードの更新をお願いいた

    テキスト整形 - MeryWiki
  • regex101: build, test, and debug regex

    An explanation of your regex will be automatically generated as you type.

    regex101: build, test, and debug regex
  • 「正規表現」を超わかりやすい図に変換してくれるサイト

    Regexper に入力して「Display」をクリック。 正規表現がチャート図に変換されて表示。 チャート図の見方は何となく分かると思いますが 一応説明しておくとこんな感じ。 左端からスタート、右端に着いたらゴール 右に向かって線を進む 分岐は好きな方を選んでよい ゴールまでの文字をつなげば それが入力した正規表現があらわしている文字列です。 ちなみに、入力欄右下にある 「Download」で、SVG(ベクター)形式 のチャート図をダウンロードでき 「Permalink」で、正規表現を自動入力するURLへジャンプできます。 正規表現が分からない人でも そのチャート図を見れば意味が分かりそうなくらい 非常に見やすいですよね。 例では簡単な正規表現を使いましたが 複雑な正規表現ではさらにサイトの威力を発揮できるはず! 正規表現を作るときはぜひ活用してみて下さい。 → 「Regexper」へ行

    「正規表現」を超わかりやすい図に変換してくれるサイト
  • 正規表現と文字列がマッチしているか簡単にチェックできるオンラインツール -RegExp playground

    正規表現と文字列を入力し、それがマッチしているかどうか簡単にチェックできるオンラインツールを紹介します。 NGの画面 正規表現のチートシート ページ下部にあるチートシートから。 . 任意の文字にマッチする(改行を除く) {n} n回の繰り返し {n,} n回以上の繰り返し {n, m} n回以上m回以下の繰り返し ? {0,1}と同じ * {0,}と同じ + {1,}と同じ \w アルファベット、数字またはアンダーバー、[a-zA-Z0-9_]と同じ \d 数字、[0-9]と同じ \s 空白文字、[\t\r\n ]と同じ […] キャラクタをクラス化 [^...} キャラクタを否定クラス化 (…) パターンのグループ化 (?:…) パターンの非格納グループ化 (?=…) 先読み (?!…) 否定先読み ^ 行の先頭にマッチする $ 行の終端にマッチする \b 単語境界にマッチ \B 単語境

  • TEST CORDING » Sassの@functionの使い方まとめ – プログラマブルな処理は@function

    Let's set up your website! Let's set up your website!

  • [ruby-list:43529] Re: 正規表現のマッチングの書式について

    Subject: [ruby-list:43529] Re: 正規表現のマッチングの書式について From: "NARUSE, Yui" <naruse@ r i c > Date: Thu, 17 May 2007 16:07:02 +0900 References: 43527 In-reply-to: 43527 naruseです。 Toshiyuki Ogura さんは書きました: > 正規表現 =~ 文字列 > と書いても、 > 文字列 =~ 正規表現 > と書いても、どちらでもいいということなのでしょうか。 正規表現 =~ 文字列 の形で呼ぶと、Regexp#=~ が呼ばれるわけですが、 これは re.c で定義されており、 rb_define_method(rb_cRegexp, "=~", rb_reg_match, 1); となっています。 つまり、実体は rb_reg_

  • 正規表現サンプル集

    今日の正規表現Tips (2008/10/05) \d 0〜9の数字を表す正規表現です。 \D 数字以外を表す正規表現です。 正規表現では小文字が大文字になると反対の意味を持ちます。 ツール 正規表現チェッカー 正規表現Tips集 Tips その1 Tips その2 テキスト編集で役立つ『正規表現のサンプル集』を詳しい説明つきで紹介。 正規表現を使ってテキスト検索&置換して仕事の効率アップを図ろう。 ≪ メニュー ≫ 1.正規表現とはなにか? 2.正規表現を使う準備 3.正規表現サンプル集【検索編】 4.正規表現サンプル集【置換編】 5.正規表現のお勉強との紹介 6.エディタの強調表示でテキストに色づけ 7.プログラムで正規表現を使う 8.正規表現サンプルリクエスト

  • K2Editorでの正規表現の解説 目次

    K2Editorでの正規表現の解説 K2Editor では検索、置換、キーワードの強調などに正規表現を使う事が出来ます。このページは、その正規表現を説明する目的で書かれています。 K2Editorで公式にサポートしているのは、K2Regexp.dll による正規表現です。これから述べる内容も、K2Regexp でサポートしているものを対象としています。 K2Regexp.dll は BREGEXP.DLL(より正しく言えば、Linux 用の Bregexp ライブラリ)に制御系の拡張をしたものです。正規表現エンジン部分は BREGEXP から変更されていないようです。 BREGEXP は Perl5(perl version 5.002 だと思われる)互換の正規表現エンジンなので、Perl の解説がほぼそのまま使えますが、Perl 自体が正規表現と密接につながっているため、うまく適応するこ

  • http://www.nextindex.net/perl/pattern.html

  • http://homepage2.nifty.com/cs/linux_command/command/grep.html

  • http://homepage2.nifty.com/cs/linux_command/re-command/text_15.html

  • binWord/blog - 索引に含まれる全項目のノンブルをずらす

    あくまで仮の話なのだが、書籍の編集作業をしていて、文記事の編集も終わり、索引のテキストデータ(項目とノンブル(ページ番号))もきっちり作ったとする。仮に、仮にだ、そういう状況になってから、「やっぱり文記事のノンブルを変更することにします。全部2ページ後ろにずれます」なんてことをいわれたら、ちょっとばかりブルーになるのが人情というものだ。DTPソフトによっては索引用のプラグインが提供されていることもあるのでこれを使えば一発だと思うかもしれない。しかし、作業の進行によっては索引を複数人で分担して作らなければいけないこともあるし、文での表記をそのまま索引で使わないこともあったりするから、意外と索引用プラグインの出番は少なかったりする。そもそもDTPのプロダクションが索引用プラグインを持っていなかったらどうしようもないし。 じゃあ、作った索引のノンブルを手作業で変更するか? 私も1桁の足し算

  • Webページのタイトルを取得する - 趣味的にっき

    Webページのタイトルを取得するプログラムを書いてみました(たいしたプログラムじゃありません)。titleタグの検索のところは正規表現使って自前で実装しています。 ファイル: htmltitle.rb #!/usr/bin/env ruby # -*- ruby -*- require 'open-uri' require 'kconv' ARGV.each do |uri| open(uri, 'r') do |file| buf = '' while line = file.gets buf << line if buf =~ /<title[^>]*>([^<]*)<\/title>/im puts Kconv.kconv($1, Kconv::EUC) break end end end endんー、かがきたら処理をあきらめるようにした方がいいかも。まぁいいや。

    Webページのタイトルを取得する - 趣味的にっき
  • COOL ONLINE - JAPAN - JAPAN ONLINE

    Ukai, or cormorant fishing, is a captivating and ancient Japanese tradition that dates back over 1,300 years. This unique fishing technique, practiced along several rivers in Japan, combines history,...

  • Perl正規表現雑技

    このページは Perl5.6 を対象としています. perl スクリプトは EUC-JP で書かれることを想定しています. このページは 正規表現メーリングリスト を参考に,私が独自にメモとしてまとめたものです. このページの正規表現やスクリプトについての詳しい説明, わかりやすい説明はおそらくできません. このページに書かれているスクリプトは, 個人の責任において実行してください. このページに書かれているスクリプトの 利用・改造は自由 です. その際はどこかにこのページの URI( http://www.din.or.jp/~ohzaki/regex.htm )を参考として記述していただければ幸いです(任意). ご意見・ご感想・ご要望などは にお願いします.こう書いた方がいい, 動かん,わからん,バグってる,これ書け,などなどお待ちしています. このページへの リンクは自由 に張ってく