タグ

2007年10月31日のブックマーク (4件)

  • log4ZIGOROu

    sitemap.xmlとは、検索エンジンに対してクロールして欲しいURLを指定したり、その指定したURLの優先度を設定したりする事が出来るXML Formatの事です。 このXMLをサイト上に置いて、Google WebMaster Tool等で通知したり、robots.txtでSiteMapのLocationを指定する事によって、検索エンジンクローラが自動的にsitemap.xmlの場所を認識して、そのxmlファイルを参考にクロールしてくれるでしょう。 今回はこのsitemap.xmlをperlで動的に書く方法です。

  • ブログが続かないわけ | Web::Scraper 使い方(超入門)

    3年前にこのに出会って、僕はスクレーピングの虜になった。 おかげで正規表現をたくさん書く機会が得られたし、CPANのモジュールともたくさん触れ合うことができたし、さらに自分自身でも構造化されたHTMLを書く習慣も身についた。 ただ、やっぱり、スクレーピングは簡単ではない部分もたくさんあると思う。文字コードについても意識しなければならないし、なにより正規表現で必要な部分を抽出することそのものが結構骨のいる作業だ。HTML::TreeBuilder を使った方がいいのか、それとも正規表現だけでやったほうが楽なのか。そんなことを考慮しながらコーディングして行く。そこがスクレーピングの楽しいところでもあるのだが、そこがスクレーピングの敷居を高いものにしていることも否めない。 そんな、愛らしくもあり憎たらしくもあるスクレーピングを簡単にやってしまうのがこのモジュール、Web::Scraper だ。

    ブログが続かないわけ | Web::Scraper 使い方(超入門)
    anigon
    anigon 2007/10/31
  • http://ja.doukaku.org/

  • CodeZine:Aptana 「HTML、CSS、JS、PHP、Ruby、AIR」 フリーの開発環境Aptana 1.0リリース(エディタ, ツール)

    Web関連の言語に対応した統合開発環境Aptanaの正式版がリリースされた。単体で提供される「Aptana IDE」とEclipseプラグイン版の2つが用意されている。Eclipseの場合は更新機能に以下のURLを登録することで入手できる。 http://update.aptana.com/install/3.2/ AptanaはHTMLJavaScriptCSSなどに対応した統合開発環境で、プラグインの追加によりPHPRubyAIRなどの開発にも利用できる。プラグインの追加はIDE起動時に表示される「Aptana Start Page」より、関連プラグインの「install」ボタンを押すことで行える。なお、プラグインの実行にあたっては各言語の実行環境を用意する必要がある。 Eclipseベースのツールのため、強力なエディタやソースコード管理システムを利用することができる。主な

    anigon
    anigon 2007/10/31