タグ

2014年10月10日のブックマーク (5件)

  • XML XPath

    XPathとは、XML文章の中の要素や属性の位置を指定するための言語です。(XPath= XML Path Language) XPathは、XML文章をツリーとしてモデル化し、各ノード(要素や属性)への位置を指定できるようにします。また、指定したノードに対して、条件判定を行ったり、文字列計算をしたり、計算結果を使用したりすることも可能です。 XPathは、XMLのツリー構造をモデル化し、その中で属性や要素の位置を特定します。 例えば、以下のようなXMLのツリー構造があったとします。 このツリーを、XPathは以下のノードに分類し管理します。(ノードとは扱うデータというような意味) ルートノード 要素ノード 属性ノード 詳しくは後述しますが、name要素を特定したい場合は、"/members/member/name"というような形で特定します。これは、ルートノード+要素ノード+要素ノード+

    GREEEN
    GREEEN 2014/10/10
  • XPath Cheat Sheet

    配列は0からではなく1から始まる([1]から) 先頭が / から始まれば絶対パス、そうでなければ相対パス、//なら全要素が対象。 ()で評価順序を考慮する

  • Mechanizeの使い方例。 - それマグで!

    RubyのMechaizeの使い方をよく忘れるので、メモする。 サンプルに図書館を使おうとして、ためにしに岡崎市立図書館を取得してみた。 岡崎市立図書館がFlashとかあり得ないサイトだった。。 まぁサンプル例として。 Mechanize起動 起動〜Basic認証設定〜ファイルを取得 require 'mechanize' mech = Mechanize.new #BASIC認証 mech.basic_auth("takuya", "****") ##ページ取得 mech.get("http://www.example.com"); ページ取得〜移動 mech.get("http://www.yahoo.co.jp"); ##"オークション"と書かれたリンクをクリック。 mech.page.link_with( :text=>"オークション").click mech.page.links

    Mechanizeの使い方例。 - それマグで!
  • 大解剖!スクレイピング比較してみた - technica

    はじめまして。14卒の能天気エンジニアです。 これから宜しくお願いします。 今回はスクレイピングの比較についてを題材にしました。 最近は業務だけでなく、私生活でもスクレイピングを使っています。スクレイピングによって今まで見づらかった情報が見やすくなったり、さらにそのデータを使って別のものを作成したりと幸せなことが多いです。 スクレイピング何?どういうこと出来るの?どうやってやるの?などなど、スクレイピングのいろはを順番に説明していきます。 スクレイピングとは 簡単にいうと今見ているこのサイト、そしていつも見ているサイトから情報を抽出することです。 HTTP経由でhtmlを取得し、htmlを解釈、DOMに変換します。任意のタグを指定し、DOMを検索、情報を取得します。あくまでもhtmlを変換するので、FLASHなどのコンテンツなどからはスクレイピングすることは出来ません。 どんなことが

    大解剖!スクレイピング比較してみた - technica
  • CSSセレクタ20個のおさらい

    CSSセレクタって意外と分かっていなかったりするので勉強ついでにまとめてみました。比較的実用的かなと思うものを20個紹介していきます。いい復習になればと思います。 CSSセレクタはスタイルを適用する対象を指定するものです。普段何気なく使っているclassやidなどもセレクタの1つです。 属性や要素といった堅苦しい用語が出てきますので図で簡単に説明します。 私のように基礎から勉強していないと、要素や属性と聞いてもピンときませんが、知ってみるとなんてことはないですね。 また、IEが対応しきれていないCSS3のセレクタもありますが、IE6~8でもCSS3セレクタが利用できるツールの決定版「Selectivizr」 で紹介したようにCSS3セレクタはie対策も容易なのでぜひお試しください。 SelectivizrはCSSを外部ファイルで指定した方がいいのですが、今回のサンプルはCSSを外部ファイル

    CSSセレクタ20個のおさらい