タグ

ブックマーク / softantenna.com (2)

  • 99%のEmailアドレスにマッチする正規表現公開される | ソフトアンテナ

    一見Emailアドレスにマッチする正規表現を組み立てるのは簡単そうに思えますが、RFC 5322に厳密に準拠した正規表現を創りだそうとするととんでも無い努力が必要となるようです。 「Email Address Regular Expression That 99.9% Works」は、様々なプログラミング言語ごとに、Emailアドレスに99%マッチする正規表現を掲載したサイトで、例えばPerl 5.10より前のバージョンのPerl用として、掲載されている長大な正規表現を見れば、その難易度の高さを確認することができます。 正規表現にはなんの解説もなくどのような意図をもって作られたのか説明はありません(よって99%マッチするかどうかは当のところは不明)。ちなみに日語で読める貴重な情報「Perlメモ」では、「perl5.6.0以前の perl ではメールアドレスの正規表現を正確に記述すること

    99%のEmailアドレスにマッチする正規表現公開される | ソフトアンテナ
  • クリックだけであらゆるサイトをスクレイピングできるWebサービス「kimono」が凄い | ソフトアンテナ

    Webスクレイピングとは、Webサイトから情報を抽出するソフトウェア技術のこと。通常サイトごとにちまちまとプログラムをつくる必要がありますが、現在ベータ中のサービス「kimono」は凄い。ブラウザを使ってクリックするだけで、WebサイトからJSON/CSV形式でデータを抽出する事ができます。 紹介動画ではイマイチなにをしているのか分からなかったので、実際に試してみました。 サインアップとブックマークレットの準備 アカウントを登録してログインするとこの画面が表示されます「kimonify」をブックマークバーにドロップして使えるようにしておきます。 スターウォーズの登場人物の名前と誕生日を抽出 実際にデータを抽出してみましょう。公式ブログ「Never write a web scraper againで使われているスターウォーズのサンプルが分かりやすいです。 まずブックマークレット「kimon

    クリックだけであらゆるサイトをスクレイピングできるWebサービス「kimono」が凄い | ソフトアンテナ
    toripika
    toripika 2014/07/17
    すげぇ〜
  • 1