タグ

2006年10月11日のブックマーク (8件)

  • HTML::TreeBuilder + CSSセレクタがいい感じな件

    先日 PerlCSSセレクタ で HTML::Selector::XPath がいい感じであると思ったわけですが、CSS セレクタだけじゃなく何気に HTML::TreeBuilder::XPath とのコンボがすげーイイ!ということにいまさら気づきました。 HTML::TreeBuilder::XPath で findnodes するとツリー状に連なった HTML::Element なデータ構造が返ってくるんですが、HTML::Element は API をかなりいろいろ持ってて、これをうまく使ってやるとスクレイピングを自然な感じで書けます。 例えばはてなダイアリーの任意のページから、文部分だけをスクレイピングしたいと思ったときにキーワードリンクが邪魔だったりするわけですが、とりあえず HTML::Selector::XPath で div.section をぶっこ抜いて取れた HT

    HTML::TreeBuilder + CSSセレクタがいい感じな件
    RIKKUN
    RIKKUN 2006/10/11
  • naoyaのはてなダイアリー - Perl で CSS セレクタ

    rubyスクレイピングして web の情報を取得するのには、今まで正規表現か xpath でやってたので、わりと面倒でした。で、ふと scrAPI というスクレイピングツールキットを知ったのですが、これがかなり便利そう。 このツールキットを使うと、CSS3 なセレクタを記述することで、要素を取得することができます。 という Ruby の scrAPI での CSS セレクタがいい感じでございますなあと指をくわえて見てたんだけど、 Per discussions in CSS Selector in Perl, I made a quick perl module HTML::Selector::XPath, which is available at http://svn.bulknews.net/repos/public/HTML-Selector-XPath/trunk/ now.

    naoyaのはてなダイアリー - Perl で CSS セレクタ
    RIKKUN
    RIKKUN 2006/10/11
  • はてなブックマークカウンターと bookmark.getTotalCount - naoyaのはてなダイアリー

    今日は二つほどはてなブックマークの新機能を公開しました。 http://hatena.g.hatena.ne.jp/hatenabookmark/20061004/1159941842 http://hatena.g.hatena.ne.jp/hatenabookmark/20061004/1159944160 はてなブックマークカウンター と、カウンターでも表示されてる数字を XML-RPC で取得できる API です。カウンターは早速この日記のサイドに表示させてみました。はてなダイアリーなら bcount モジュールで。 API の方ですが、告知で書いてるサンプルスクリプトで好きなサイトのブックマーク数とかを調べられます。 #!/usr/local/bin/perl use strict; use warnings; use XMLRPC::Lite; my $url = shift

    はてなブックマークカウンターと bookmark.getTotalCount - naoyaのはてなダイアリー
  • 秋の夜長にはバラゲーとかいかが?

    バランスをとるゲームって、 単純だけど全身使ってる感じで、面白い。 とても可能性を感じます。 秋元さんに教えてもらったこのゲームをやりながら、 そんなことを思いました↓ BALANCE! by Alex Heaton 単に落ちないようにバランスを取るだけなんだけど、 妙に熱くなります。 レベル7くらいからが超ムズいです。 今のところ、ベストスコアは1759点。 このゲーム、もしかしたら、 ちゃんと作りこんだら、相当面白いんじゃない? という気がしました。 単純で、中毒性がある。 テトリスに近いものを感じます。 頭の変な部分を使っている気がするところも似てる。 加えて、例えばこんなマウスを動かしてるだけのゲームでも、 身体感覚的には、全身でバランス取ってる気がします。 毎日バランスボールの上で正座している経験上、 バランスを取るのはとても身体にいいって知っているので、 このゲームも、そういう

    秋の夜長にはバラゲーとかいかが?
  • マイクロフォーマット=Web2.0の真打ちとなるか?

    米マイクロソフトやYahoo!が積極的な取り組みを始めた「マイクロフォーマット」。ブログ検索でおなじみのテクノラティに、マイクロフォーマットがWeb2.0ブームの真打ちになる可能性を聞いた。 連載目次 マイクロソフトやYahoo!など大手が参加表明 米マイクロソフトやYahoo!が「マイクロフォーマット」への積極的な取り組みを公表したり、ブログ検索でおなじみのテクノラティが主宰している実験サービスサイトのTechnorati Kitchenで、「Microformats Search」が公開されるなど、「Web2.0ブームの真打ち“マイクロフォーマット”がついに表舞台に登場か」と思わせるニュースが相次いでいる。 「マイクロフォーマット=Web2.0の真打ち」などといういい方には、反論があるかもしれない。だが、技術者でない筆者が昨年来のWeb2.0ブームで語られる数々の概念や方法論をふかんし

    マイクロフォーマット=Web2.0の真打ちとなるか?
  • 404 Blog Not Found:javascript - ある意味究極のソースコード添付法

    2006年10月10日06:15 カテゴリLightweight Languages javascript - ある意味究極のソースコード添付法 ころたま。なんでこれを今まで思いつかなかったか! 以下のHTMLをコピペして、 <script type="text/javascript" src="http://blog.livedoor.jp/dankogai/js/sourceviewer.js"></script> <script>//<![CDATA[ var sourceViewer = new SourceViewer(); sourceViewer.boot(sourceViewer, 'sourcecode'); //]]></script> <style> .sourcecode { display: none } </style> あとは <textarea class=

    404 Blog Not Found:javascript - ある意味究極のソースコード添付法
  • 「svchost.exe」の正体を探る - GIGAZINE

    CtrlキーとShiftキーとEscキーの同時押しで起動するタスクマネージャを使うと、「プロセス」のところにいくつも「svchost.exe」というのが見えます。一体これはなんだろう?ということで怪しがって削除してしまったり、強制的に終了させてウインドウズごと強制再起動させられたりといった目にあった人もいるかと思います。 また、時々この「svchost.exe」がCPU使用率100%になってしまい、困っているが一体何が原因なのかわからない場合があります。そういった際に「svchost.exe」の正体を探る方法を知っていると問題解決に役立ちます。 というわけで、「svchost.exe」の正体を探る方法を紹介します。 Svchost.exe の説明 要するに、「svchost.exe」とは起動時に読み込まれる「サービス」であるわけですが、以下のタスクマネージャの例を見てもわかるように、一体ど

    「svchost.exe」の正体を探る - GIGAZINE
  • Part1 Web APIプログラミングに挑戦しよう! - Google/Amazon/Yahoo! Webサービス徹底活用:ITpro

    いま,Webの世界は大きく変わろうとしています。検索エンジンはどんどん進化し,ブログやSNS(Social Networking Services)といった新しいアプリケーションが登場して,Webの用途は広がり,便利になっています。 プログラマにとってのWebの姿も大きく変わっています。従来,Webでプログラミングといえば,サーバーで動作するWeb/DBアプリケーションの構築か,JavaScriptで動的なWebページを作成することを指すのがほとんどでした。最近はこれに加えて,Web上に散在するAPI(Web API)を利用するプログラミングが流行しつつあるのです。 インターネット上のサービスを 自分のプログラムに組み込める 「API」と言えばOSの機能をプログラムから利用するための窓口というイメージがあると思います。Web APIとは,WebにおけるAPI,つまりWeb上にあるサービスを

    Part1 Web APIプログラミングに挑戦しよう! - Google/Amazon/Yahoo! Webサービス徹底活用:ITpro