はじめに PhantomJS - Scriptable Headless Browser PhantomJS はヘッドレスな(ブラウザ画面のない)QtWebKit ベースのブラウザで、JavaScript の API を通じて、そのブラウザを自由自在にあやつることが出来ます。使用シーンとしては、Jenkins などの CI ツールとの組み合わせによる Web ページの GUI の自動テストや、Web ページのスクリーンキャプチャ、スクレイピングなどが挙げられます。 今回は、ログインが必要なページの情報をパースして自分専用に RSS 化したいなと思い、3つ目のスクレイピング用途をベースに調べてみました。その内容を備忘録として残しておきます。 出来るようになること ログインが必要なページの HTML を取ってくる ログインが必要なページのスクリーンキャプチャを撮る PhantomJS の導入
ブラウザがログイン情報を覚えてくれないこと多いじゃないですか。 ユーザ名とパスワードを入力&ログインボタンを押してくれるブックマークレットを作ってみました。 ただ、サイトごとに作り替えないといけないレベルの代物です。 ■概要 javascript:(function(){ //ユーザ名を入力 n=document.getElementsByName("username"); n.item(0).value="usernameHERE"; //パスワードを入力 p=document.getElementsByName("password"); p.item(0).value="passwordHERE"; //フォームを実行 f=document.getElementsByTagName('form'); f.item(0).submit(); })(); サイトに合わせて変更が必要な項目は
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く