[B! 正規表現] okyawaのブックマーク

okyawa id:okyawa

正規表現に関するokyawaのブックマーク (29)

文字数のカウントはどれが正解なのか?
A. ユースケース次第でどう実装すべきかは変わる。Intl.Segmenter が万能というわけでもない。 (クソ最悪な小バズをかましてしまったので、贖罪も兼ねて記事を書きました) 「文字数を数える」のは難しい「文字数を数える」実装は意外と難しいです。というのも、アルファベットや数字だけなら str.length でも正しく数えられますが、絵文字や異体字などが入った文字列は見た目どおりに数えられません。
okyawa 2024/04/10
javascript

正規表現

js

TypeScript

文字コード

emoji

絵文字

Intel
リンク
Vimで正規表現を使ってスネークケースとキャメルケースを相互変換する - 無理しない感じ
Vimでスネークケースとキャメルケースを相互に変換する方法を紹介します。スネークケース -> キャメルケース以下のような文字列を変換する hoge_fuga_piyo_foo_bar_baz コマンドラインモードで以下のように入力 :%s/\v_(.)/\u\1/g 結果 hogeFugaPiyoFooBarBaz スネークケース -> アッパーキャメルケース(パスカルケース) 以下のような文字列を変換する hoge_fuga_piyo_foo_bar_baz コマンドラインモードで以下のように入力 :%s/\v(^|_)(.)/\u\2/g 結果 HogeFugaPiyoFooBarBaz キャメルケース -> スネークケース以下のような文字列を変換 hogeFugaPiyoFooBarBaz コマンドラインモードで以下のように入力 %s/\v([a-z]\@=)([A-Z])/\
okyawa 2022/06/17
vim

置換

正規表現

変換

キャメルケース

スネークケース
リンク
ElasticSearchの「正規表現」「ワイルドカード検索」は性能的にも業務的にもメリットが薄かった - きり丸の技術日記
Qiitaで書いた記事を微妙に書き直して、はてなブログに移行させます。「ElasticSearchで正規表現やワイルドカード検索がしたい！」という顧客要望に応えるため、何とかできないか試したときのメモ。環境 ElasticSearch 結論データ型がkeywordのフィールドに対しては、正規表現検索は有効データ型がtextのフィールドに対しては、意図に沿わないことが多い書かないこと正規表現検索で劣化する性能の具体的な値原因データ型がkeywordはアナライザによる単語分割が行われないため、正規表現で目的の単語がヒットしやすいです。データ型がtextのフィールドはアナライザによる文字数分割が行われます。また、ワイルドカードを使用した場合は「A * B」で一単語と判断します。一単語として扱うため、分割文字単位より長い単語をヒットさせることができません。むしろワイルドカ
okyawa 2021/10/20
elasticsearch

wildcard

ワイルドカード

正規表現

検索
リンク
ハイフン無しの電話番号をハイフン付の形式に変換してみる - Qiita
固定電話の場合0{市外局番1～4桁}-{市内局番1～4桁}-{加入者番号4桁}となっており、合わせて10桁、市外局番（国内プレフィックス含む）と市内局番をあわせて6桁固定となっているようです。（画像は総務省に掲載のもの）他にも「010」から始まる国際電話番号プレフィックスや、警察（110）、消防（119）、時報（117）などありますが、今回は実装対象外とします。携帯電話、PHSなど0A0-CDE-FGHJKの番号は、初期契約時の事業者を特定できますが、不要なので対象外とします。ちなみに書いている途中で「オープンデータ化されていないのかな？」と思って検索してみたらされてました。電気通信番号指定状況が、上記ページのファイルへのリンクがあるだけでした。定期的にアップデートする仕組みとか作れるといいかなと思ったんですけどね。実装どう実装するか？仕様はある程度理解できました。固定電
okyawa 2019/11/12
変換

電話番号

php

正規表現
リンク
iOSエンジニアの正規表現入門 - Qiita
文字クラス [abc] abcいずれか1文字 [^abc] abc以外の文字 [a-z] aからzまでの子文字アルファベットのいずれか1文字。(ハイフンなどを含めたい場合[-a-z]) [A-Z] AからZまでの大文字アルファベットのいずれか1文字 [0-9] 0-9の数字のいずれか1文字 [A-Za-z0-9] 結合したパターン。A-Zまたはa-zまたは0-9の英数字 [a-z&&[^bc]] bとcを除くa-z。[ad-z]と同義 (abc) カッコ内の文字列をひとつのグループとして管理する (abc|def) abc, defの文字列のいずれか (?:abc)：肯定先読み abcに一致する文字列が始まる位置にある検索文字列と一致する。一致した文字列はキャプチャはされない。industry|industriesと指定する代わりに、industr(?:y|ies)と指定することができる。
okyawa 2018/06/04
ios

swift

regex

正規表現
リンク
Swift 3.0での基本的な正規表現を行うextension - Qiita
import Foundation extension String { //絵文字など(2文字分)も含めた文字数を返します var length: Int { let string_NS = self as NSString return string_NS.length } //正規表現の検索をします func pregMatche(pattern: String, options: NSRegularExpression.Options = []) -> Bool { guard let regex = try? NSRegularExpression(pattern: pattern, options: options) else { return false } let matches = regex.matches(in: self, options: [], range: N
okyawa 2018/06/04
swift

regex

extension

置換

正規表現
リンク
よく使う正規表現はもうググりたくない！ - Qiita
タイトル通りによく使う正規表現を毎回ググるのが効率悪いのでまとめてみました。各言語で正規表現のサンプルを書いてみました。正規表現式 Em ailアドレス ^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$ ドメイン名 ^[a-zA-Z0-9][a-zA-Z0-9-]{1,61}[a-zA-Z0-9]\.[a-zA-Z]{2,}$ インタネットURL ^(http|https)://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ ユーザー名 (Twitter username) ^[a-zA-Z0-9_\-.]{3,15}$ 固定電話 ^0\d-\d{4}-\d{4}$ 携帯電話 ^(070|080|090)-\d{4}-\d{4}$ IP電話 ^050-\d{4}-\d{4}$ フリーダイヤル ^0120-\d{3}-\d{3}
okyawa 2017/12/11
正規表現

regex

javascript

php
リンク
PostgreSQLでのバックスラッシュ文字の扱い - Qiita
PostgreSQLの文字列リテラルでは、バックスラッシュ文字の意味が standard_conforming_stringsという設定によって変わるようです。 standard_conforming_stringsが"off"のときは、バックスラッシュは特殊文字として機能します。「\n」はAscii文字のLFで、「\t」はTABとして解釈されます。一方、standard_conforming_stringsが"on"のときは標準SQL仕様準拠モードとなり、バックスラッシュはただの「バックスラッシュという文字そのもの」として解釈されます。「\n」は「\」と「n」の２文字となります。このあたりことは以下のページの方が詳しいですのでそちらをどうぞ。 PostgreSQLは標準でバックスラッシュをエスケープしない仕様になった | 徳丸浩の日記元々、標準のSQL仕様的には、バックスラッ
okyawa 2017/08/23
postgresql

regex

正規表現
リンク
正規表現再入門/introduction-to-regex
2016/11/03 PHPカンファレンス2016
okyawa 2016/11/04
php

正規表現
リンク
正規表現 /g と \G - suu-g's diary
Perlの正規表現、 \G の項目がどうにも分からん！だって末尾に /g をつけたら最後まで検索しちゃうんでしょ？ $html =~ s/\G\s*<h[1-6]>/<span class="dekamoji">/g; みたいなのが何の意味があるのさ？ ↑つい二時間前まではこう思ってた。でも、それは大きなミステイクだった。 \Gもまた、正規表現の能力を単なるマッチや置換から大幅にパワーアップさせてくれる要素だったんだ。勘違いの始まりは、正規表現を学べば誰もが目にする s///g からだった。 $mojiretsu =~ s/hogehoge/fugafuga/g; とすると、検索文字列 $mojiretsu 中のすべての hogehoge を fugafuga に置換する。でも、それだけだとあまりよい理解じゃなかったんだ。 s///g と似た形をしている、 m//g というコンテキ
$正規表現 /g と \G - suu-g's diary$
okyawa 2015/02/10
正規表現

perl

preg

置換
リンク
Perl正規表現雑技
このページは Perl5.6 を対象としています． perl スクリプトは EUC-JP で書かれることを想定しています．このページは正規表現メーリングリストを参考に，私が独自にメモとしてまとめたものです．このページの正規表現やスクリプトについての詳しい説明，わかりやすい説明はおそらくできません．このページに書かれているスクリプトは，個人の責任において実行してください．このページに書かれているスクリプトの利用・改造は自由です．その際はどこかにこのページの URI( http://www.din.or.jp/~ohzaki/regex.htm )を参考として記述していただければ幸いです(任意)．ご意見・ご感想・ご要望などはにお願いします．こう書いた方がいい，動かん，わからん，バグってる，これ書け，などなどお待ちしています．このページへのリンクは自由に張ってく
okyawa 2015/02/10
正規表現

perl

preg

置換
リンク
正規表現によるバリデーションでは ^ と $ ではなく \A と \z を使おう
正規表現によるバリデーション等で、完全一致を示す目的で ^ と $ を用いる方法が一般的ですが、正しくは \A と \z を用いる必要があります。Rubyの場合 ^ と $ を使って完全一致のバリデーションを行うと脆弱性が入りやすいワナとなります。PerlやPHPの場合は、Ruby程ではありませんが不具合が生じるので \A と \z を使うようにしましょう。はじめに大垣さんのブログエントリ「PHPer向け、Ruby/Railsの落とし穴」には、Rubyの落とし穴として、完全一致検索の指定として、正規表現の ^ と $ を指定する例が、Ruby on Rails Security Guideからの引用として紹介されています。以下の正規表現は、XSS対策として、httpスキームあるいはhttpsスキームのURLのみを許可する正規表現のつもりです。 /^https?:\/\/[^\n]+$/
okyawa 2014/03/05
PHP

正規表現

regex

regexp

セキュリティ

ruby

Validation
リンク
PHPの独特な正規表現関数：mb_ereg_search - hnwの日記
直前の記事「mb_ereg_replace関数でe修飾子を使う際の注意点」で利用しているmb_ereg_search_ナントカという関数群は特徴的な関数ですが、あまり使用例を見ない関数です。今回はこの関数群の概要を紹介します。この関数群は正規表現マッチを行うmb_ereg系関数のバリエーションの一つです。前回正規表現マッチした場所を覚えていて、再度呼び出すと前回のマッチングに引き続いて正規表現マッチを行います。これを使うと、次のように正規表現マッチ毎に何かの処理を行うループが作れます。 <?php mb_ereg_search_init($subject, $pattern, $option); while (mb_ereg_search()) { $matches = mb_ereg_search_getregs(); // マッチした内容ごとの処理 } Perlだとm/../gでルー
okyawa 2013/05/01
ereg

正規表現

regex

php
リンク
[PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ！
ウノウラボ Unoh Labs: PHPのちょっとしたコツ　最近のスクリプト言語は機能が多く、基本的な機能はほとんど実装されているので、アルゴリズムをどうこうするより、どの機能を使うか選ぶ方が重要だったりしますね（コーディングの効率的にも）。　自分にもそういったレベルで気をつけていることがいくつかあります。 -［早起き生活］PHPのパフォーマンスチューニング -［早起き生活］PHPのパフォーマンスチューニングその2：count()も使い過ぎると重くなる -［早起き生活］PHPのパフォーマンスチューニングその3：APC投入　あと、最近気づいたTIPSとしては、日本語を正規表現検索したいときでもereg系の関数を使うのはやめとけなんてのもあります。　PHPの組み込み正規表現関数にはPHP独自のereg系とPerl互換のpreg系がありますが、ヘルプに書いてあるとおり、ereg系
okyawa 2012/12/21
php

regex

正規表現

preg

ereg
リンク
JavaScriptでうっかりやってしまいそうなこと色々
こんにちは、中川です。今回はJavaScriptで開発していると、うっかりハマってしまうちょっとした罠たちを紹介したいと思います。 JavaScriptでの開発経験者であれば、どれか一度はひっかかったことがあるのではないでしょうか？ String ●String#replace()は文字列指定では全部置き換えない対象文字列を一括して置き換えたいなどでString#replace()を使いますが、検索対象を文字列で指定してしまうと最初に一致した部分しか置換しません。
okyawa 2012/11/02
javascript

正規表現

tips
リンク
正規表現 - マンガで分かる JavaScriptプログラミング講座
遊：先生の話は最近難しすぎるわ少しは私の頭に合わせて簡単にしてよ！先生：…その台詞言っていて悲しくないか？遊：ちょっとだけ麗：それで先生今日の内容は何ですか？先生：あーすまんこれはお前たちには難しすぎるな説明するのはやめるよ麗：では遊を除け者にして話を進めてください遊：何〜！それは許さん！守：それで今日の内容は何ですか？先生：『正規表現』だ 3人：正規表現！？遊：何それ？先生：文字列の検索や置換を行うための特殊なルールだ遊：はー（姿勢を変える）この期に及んで新しいルール？ルールルールルール！私たち学生は校則でがんじがらめよ！遊：でそれを使うと世の中手抜きで渡っていけるの？先生：渡っていける他人の読書感想文を書き換えて自分のものにしたりできる遊：先生ぜひ教えてください先生：それじゃあ『置換
okyawa 2012/07/25
正規表現

javascript

置換

replace

regexp
リンク
JavaScriptでの正規表現を覚えたいときに激しく使えるチートシート - IDEA*IDEA ～百式管理人のライフハックブログ
ドットインストール代表のライフハックブログ
okyawa 2010/01/22
javascript

正規表現

regexp

まとめ
リンク
コーディング技法
Download Visual Studio 2003 Retired Technical documentation from Official Microsoft Download Center Internet Explorer was retired on June 15, 2022IE 11 is no longer accessible. You can reload Internet Explorer sites with IE mode in Microsoft Edge.
okyawa 2009/08/20
海外の電話番号形式

電話番号

正規表現
リンク
Rubular: a Ruby regular expression editor and tester
Rubular is a Ruby-based regular expression editor. It's a handy way to test regular expressions as you write them. To start, enter a regular expression and a test string. Or you can try an example.
okyawa 2009/08/20
正規表現

webサービス

ツール
リンク
ブラウザ上で正規表現のチェックができるエディタ「Rubular」 | Web制作技術 | 阿部辰也のブログ――人生はひまつぶし。
既にはてブ数が300近いサイトなんで、結構有名だとは思うんですが自分的にはかなり感動したのでご紹介。ブラウザ上で正規表現のチェックができる「Rubular」というサービスです。ページ上部の「Your regular expression」という項目に正規表現を入力し、その下の「Your test string」の項目に正規表現でチェックしたい文字列を入力。すると、自動的に右下の「Match result」の項目にマッチした文字列が強調されて表示されます。試しに、半角数字と半角の「.」(ドット)以外の文字が含まれているかどうかチェックする簡単な正規表現でテストしてみた結果が、以下のスクリーンショットです。しっかり半角数字と半角の「.」(ドット)以外の文字が強調されているのが分かります。さらに、以下のスクリーンショットのように、日本語の正規表現にも対応していることが判明。これは凄い
okyawa 2009/08/20
正規表現

webサービス
リンク
1 2 次のページ