タグ

ブックマーク / blog.bulknews.net (3)

  • HTML::Selector::XPath をリリース: blog.bulknews.net

    HTML::Selector::XPath をリリース CSS Selector in Perl とか subtech - Bulknews::Subtech - CSS selector to XPath あたりで議論していた CSS 2 Selectors to XPath コンパイラなモジュールをつくって、CPAN に HTML::Selector::XPath としてリリースしました。 使い方は naoya さんが先に書いてますが、HTML から正規表現を使うことなくスクレイプするのに便利。たとえば Mixi にログインしてマイミク最新日記と、1件目のタイトル、文を抜き出すコードが、以下のようにかけます。 #!/usr/bin/perl use strict; use warnings; use utf8; use Encode; use HTML::Selector::XPat

    nnn3
    nnn3 2007/03/24
    HTMLに対してXPath 正規表現より便利
  • CPAN::Mini で CPAN のミラーをローカルに: blog.bulknews.net

    CPAN::Mini で CPAN のミラーをローカルに DECON で話してきたネタですがちょっと詳しく。 飛行機やら電車の中やらでオフラインハックするときに(たまに)問題になるのが CPAN モジュールの不足です。「あぁ、このマシンにはあのモジュール入ってねぇ~」とかでハックが滞るのは萎えます。というわけで minicpan。CPAN::Mini というモジュールで、CPAN モジュールの最新版だけを持ってきてミラーをつくることができます。 導入は簡単で、CPAN から install CPAN::Mini すると minicpan というコマンドが付属してきます。コマンドラインから使うには、 > minicpan -r http://ftp.funet.fi/pub/languages/perl/CPAN/ -l ~/minicpan とかすれば finet から HTTP で同期で

  • 学校では教えてくれないエンジニアリング英語 #1: blog.bulknews.net

    学校では教えてくれないエンジニアリング英語 #1 ソフトウェアエンジニアリングの現場で使うような英語って、たまにクセがあったりしてわかりにくかったりすることってありますよね。年に半分程度US出張も含めて外資系で1年半やってきた経験から、エンジニアの日常会話で使う英語を解説していくシリーズを不定期連載してみようかとおもいました。 よく海外在住の日人ブロガーの方が同じような企画やってますが、エンジニアリングに直結したのは少ないかなとおもったので。あと当然ですが、僕はネイティブじゃなく、業務やら日常会話やらで覚えてきた内容をもとに書いているので間違いがあれば指摘は歓迎です。 第1回の今日は、記号の読み方。最初、結構とまどったんですよね。 "-" "-" をなんと読むか。日人だとハイフンが多いでしょうか。アメリカ英語では、"dash (ダッシュ)" と読みます。"minus (マイナス)" で

  • 1