タグ

DOMに関するe_kosaのブックマーク (2)

  • DOMってなに

    ◆ はじめに 従来のブラウザにおけるオブジェクトな視点は、ブラウザ自身でした。それは、ブラウザにとっては都合が良いものだったのですが...。 時代は、ブラウザそのものより、ブラウザで扱うXML文書やHTML文書(以下、HTML/XML文書)のデータとしての価値へと移ってきました。そして、その視点からのオブジェクトへアクセスするインターフェイスがW3Cで仕様検討され、ドキュメントオブジェクトモデル (Document Object Model - DOM)としてまとめられました。 ◆ DOMとは ドキュメントオブジェクトモデル (Document Object Model - DOM) は、HTML/XML文書にある入力フィールドやイメージ、段落など、すべての要素に対して参照/更新するための、また、ドキュメント主体の視点から見たオブジェクトへアクセスするためのインターフェイスなモデルです。

  • スクレイピングはもっと簡単にならなければいけない - bits and bytes

    スクレイピングをやったことがあるひとならばわかると思うけど、スクレイピングはとてもつまらない作業だ。 HTMLの中から抜き出したい部分を見つけて、その周辺にある特徴的な部分に着目して正規表現を書いたりして抜き出す。あるいはHTMLからDOMを生成して特定のクラスがついているエレメントを抜き出したりする。HTMLをXHTMLに整形、変換してXPathで抜き出す方法もある。どの方法もやることは単純で簡単なことだけれど、極めてめんどくさい。 そういうものだと思って数年間過ごしてきたけれど、去年の夏に出てきた Dapper: The Data Mapper は、そんな退屈な常識をモダーンなajaxでもって吹き飛ばした。もしDapperがどんなのなのか知らなかったら、ちょっと長くてはじめ退屈なんだけど デモムービー を見てみてください。 Dapperが教えてくれたことは、スクレイピングなんて、欲し

  • 1