タグ

ブックマーク / tama-san.com (2)

  • Unicodeで「漢字」の正規表現 – ものかの

    改訂:2017/07/22 Unicode 10.0に合わせて書き直し。正規表現を簡易にしようとしてやりすぎていたのを修正。 改訂:2023/03/21 U+30000以降を追加。InDesignの正規表現を追記。 正規表現で漢字の範囲指定をする場合、Unicodeではどうするかが悩ましいところです。 Unicodeの漢字の範囲として [一-龠] にしている例を見かけます。しかしこれは旧規格JIS X 0208の漢字が含まれる範囲をUnicodeの中から切り出しているだけです。互換漢字ブロックをまるごと取りこぼしているので、WindowsのシフトJIS(CP932)の拡張漢字に当たるものが含まれていません。現規格JIS X 0213の第3・第4水準漢字も考慮されていません。簡易な範囲指定だとしても、新常用漢字の「𠮟」が含まれておらず、今から見るとあまりに時代遅れです。 Unicodeのす

    Unicodeで「漢字」の正規表現 – ものかの
  • ReadMe (Libera Memory)

    Libera Memory Mac OS X はディスクアクセス時に生成される IO バッファをメモリ内にキャッシュとして保持し続けます。再度ディスクアクセスが発生した時にそのバッファキャッシュを使うことで処理を速くする仕組みになっています。この仕組みを Unified Buffer Cache(UBC)といいます。 アクセスがなければ古いバッファキャッシュから消えていきます。普通に OS を使う程度であれば、UBC は快適さを提供してくれます。しかし、たとえば巨大なファイルを多量に次から次へと処理し続けるような状況では、再利用されることのない不要なバッファキャッシュがどんどん溜まり、物理メモリの空き容量が圧迫されてシステムのパフォーマンスが低下してしまうことがあります。 技術には必ず「落としどころ」があります。それが優れた技術であるならなおさらです。UBC もすべての状況でその利点を発揮

  • 1