タグ

2009年3月15日のブックマーク (8件)

  • Mac OS X Server Snow Leopardに採用されるZFS--そのメリットは? - builder by ZDNet Japan

    ついに消費者向けOSに最新のファイルシステムが搭載 Grand CentralだけではMicrosoftへの対抗策として十分でないと言わんばかりに、AppleはZFSに取り組んだ。信頼性のある、高性能のファイルシステムを作り上げるには何年もかかるが、Microsoftにはこれに対抗するのに何年もかけるわけにはいかない。 公式発表では、AppleはSnow Leopardのサーバ版にZFSを導入するという。HPS+も最初はサーバ版に導入された。 誰に影響があるの? これはデータを保存するすべての人に影響することだ。 MicrosoftのNTFSはDECから借りた20年前の技術であり、小さなディスクや貧弱なCPUには適していた。しかし、今日のデータ集中型のシステムやアプリケーションにはあまりいいとはいえない。 知らないうちにデータが破損することもよくある。ユーザーがこれに気付かないのは、DLL

    Mac OS X Server Snow Leopardに採用されるZFS--そのメリットは? - builder by ZDNet Japan
  • Perlの正規表現のバグ? (前編) - moriyoshiの日記

    「鬼車の[[:print:]]はPOSIX流じゃないらしい」でid:ockeghemさんやid:nihenさんと先週いろいろやりとりしてた中で、一つだけ解決していない問題があった。 utf8フラグが立っているかどうかでPOSIX文字クラスのマッチの挙動が変わるという件。 大変詳しい調査をありがとうございます。トラックバックのブログに書いたように、[:print:]の挙動は、Perlでもutf8フラグの有無でも変わってくるようです。[:print:]は実用できないなと思いました え?まじ?と思うも、一応Perlのコード例も出していたので検証しないわけにはいかない。以下のようなコードで試してみたが、utf8フラグが立っていない場合と同じ結果となり、再現しないのだ。 use encoding 'utf8'; for (split //, "\t\r\n a") { printf("%d:%d:%

    Perlの正規表現のバグ? (前編) - moriyoshiの日記
    ockeghem
    ockeghem 2009/03/15
    これはすごい
  • 正規表現メモ

    \x{} \pは後続する名前が表すクラス(プロパティ、スクリプト、ブロック)に属する文字にマッチし、 \Pは後続する名前のクラスに属さない文字にマッチします。 クラスの名前が一文字のときはブレースを省略できます。 クラス名の前に^を置くことにより否定形の指定を行うことも可能です。 Perl 5.8 での変更点 Perl5.8以降(5.6でも使えたようですが)では \pや\Pで始まるプロパティ指定に標準Unicode属性を使うこともできます。 詳しくは perlunicode perlunicode - Perl における Unicode サポート を参照してください。 日語による説明が Unicodestandard にもあります。 Perl 5.8以降ではユーザーが任意のプロパティを作成することができます (IsまたはInを必ず前置)。 詳しくは perlunicode perluni

  • PHP: preg_match - Manual

    Getting Started Introduction A simple tutorial Language Reference Basic syntax Types Variables Constants Expressions Operators Control Structures Functions Classes and Objects Namespaces Enumerations Errors Exceptions Fibers Generators Attributes References Explained Predefined Variables Predefined Exceptions Predefined Interfaces and Classes Predefined Attributes Context options and parameters Su

    ockeghem
    ockeghem 2009/03/15
    /uオプションでUTF-8対応になると聞いてやってきましたが、そういう細かいことは載っていないのですね
  • 2006-12-13

    評伝シャア・アズナブル 《赤い彗星》の軌跡 下巻 (KCピ-ス) 作者: 皆川ゆか出版社/メーカー: 講談社発売日: 2006/12/07メディア: 新書購入: 5人 クリック: 43回この商品を含むブログ (92件) を見る 読破!当に他人事とは思えないぜ。。。 っていうか、Amazonランキングで20位台って初めて見た。(w まずは、この辺(1・2・3・4・5)を参照してもらった上で、どうしてこうなっているのか説明をしたいと思います。 書こうと思ったキッカケはオレンジニュースで掲載されていたので。 参照して頂ければ(参照しなくても)分かると思いますが、PHP4系統ではマルチバイト対応正規表現関数(mb_ereg系)はUTF-8の文字列を正しく処理できませんが、PHP5系統では正しく処理できます。 理由は簡単で、PHP4系統とPHP5系統ではマルチバイト対応正規表現ライブラリの実装が全

    2006-12-13
    ockeghem
    ockeghem 2009/03/15
    mb_eregがUTF-8をうまく扱えないのは、PHP4の話なのですね。まぁそうだろうな
  • 「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う:phpspot開発日誌

    Information Flow and Stock: [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ! なので、できる限りpreg系の関数を使いたいわけですが、検索対象や検索パターンに日語が含まれているときは、日語処理に対応したereg系の関数であるmb_ereg系の関数が使われることが多いようです。 以前、「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う方法。 以前はmb_eregによる方法を示しましたが、次の方法の方がうまく動作するようです。 preg_match_all('/[一-龠]+|[ぁ-ん]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+/u', $strToSplit, $aMatches); print_r($aMatches); // マッチ結果が全出力 確かに、なぜか取れない漢字があ

  • [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ!

    ウノウラボ Unoh Labs: PHPのちょっとしたコツ  最近のスクリプト言語は機能が多く、基的な機能はほとんど実装されているので、アルゴリズムをどうこうするより、どの機能を使うか選ぶ方が重要だったりしますね(コーディングの効率的にも)。  自分にもそういったレベルで気をつけていることがいくつかあります。 -[早起き生活]PHPのパフォーマンスチューニング -[早起き生活]PHPのパフォーマンスチューニング その2:count()も使い過ぎると重くなる -[早起き生活]PHPのパフォーマンスチューニング その3:APC投入  あと、最近気づいたTIPSとしては、 日語を正規表現検索したいときでもereg系の関数を使うのはやめとけ なんてのもあります。  PHPの組み込み正規表現関数にはPHP独自のereg系とPerl互換のpreg系がありますが、ヘルプに書いてあるとおり、ereg系

  • .NET の正規表現 - .NET

    正規表現を使用すると、強力、柔軟、そして効率的な方法でテキストを処理できます。 正規表現によるパターン一致の広範な表記法を使用すると、大量のテキストをすばやく解析し、次のことを行うことができます。 特定の文字パターンを検索する テキストを検証して、定義済みのパターン (電子メール アドレスなど) と一致することを確実にする テキスト部分文字列の抽出、編集、置換、または削除を行う 抽出された文字列をコレクションに追加して、レポートを生成する 文字列処理や大量のテキストを解析する多くのアプリケーションにとって、正規表現は欠くことのできないツールです。 正規表現のしくみ 正規表現を使ったテキスト処理の最も重要な部分は、.NET の System.Text.RegularExpressions.Regex オブジェクトによって表される正規表現エンジンです。 正規表現を使ったテキスト処理では、正規表

    .NET の正規表現 - .NET