CrossRefのブログ“CrossTech”で、DOI(デジタルオブジェクト識別子)にマッチする正規表現についての記事が掲載されています。 それによると、7,490万件のCrossRef DOIのうち、7,440万件は /^10.\d{4,9}/[-._;()/:A-Z0-9]+$/i という正規表現でマッチすることができますが、残り50万件に対応するためには /^10.1002/[^\s]+$/i /^10.\d{4}/\d+-\d+X?(\d+)\d+<[\d\w]+:[\d\w]*>\d+.\d+.\w+;\d$/i /^10.1021/\w\w\d++$/i /^10.1207/[\w\d]+\&\d+_\d+$/i というパターンも必要で、しかもこれでも7.2万件はマッチできずに残ってしまうということです。 DOIs and matching regular expressio
![DOIにマッチする正規表現(記事紹介)](https://cdn-ak-scissors.b.st-hatena.com/image/square/7cab7903e416b2fdf7371adec7e411f5c8034d8a/height=288;version=1;width=512/https%3A%2F%2Fcurrent.ndl.go.jp%2Fwp-content%2Fuploads%2F2022%2F09%2FOGP.png)