[B! googleappengine][HTML] sin_cosのブックマーク

sin_cos id:sin_cos

googleappengineとHTMLに関するsin_cosのブックマーク (1)

Slim3+Twitter4jでTwitterボットを作った - Life, Education, Death
目標スクレイピングして必要な情報を取ってくるスクレイピング対象の更新に合わせて、起動するスクレイピングした情報をまとめて、Twitterにポストする実装スクレイピング XPathなどを使ってクールにスクレイピングを決めようと思っていたが、壊れたHTMLも読めるようなちょうどいいライブラリが見つからなかったので、jericho html parserを今回は使った。 HTML以外にもPHPが読めたりと多機能なパーサーだが、XPathが使えない。ここからダウンロードして、WEB-INF/libに配置した。 final Source source = new Source( new URL("http://google.com/") ); Element el = source.getElementById("ghead") .getAllElements(HTMLElementNa
sin_cos 2011/01/06
HTML

GoogleAppEngine

slim3
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx