タグ

TagSoupとHTTPに関するyuutookunのブックマーク (1)

  • ぬるもでら Android開発 #14 HTMLのパース

    NextTrain互換アプリであるjNTrainにWebからの時刻表取り込み機能を組み込めないかと研究中。 というわけで、先日JavaでのHTTP通信を試し、こちらは問題なさそう。 時刻表のURLまでたどり着ければ、時刻表データの含まれているHTMLファイルが取得できるわけですが、このままではデータとして扱いにくい。 HTMLは結局のところテキストファイルですので、一定の法則性を見つけ出して抜き出す文字列操作だけでも何とかなるのですが、ちゃんとHTML構文とかをたどっていったほうが後々仕様変更にも対応しやすいのではと、HTMLパースの方法を調べてみました。 JavaHTMLパーサにはいろんなものがあるようなのですが、AndroidのSDKでも使用されているというTagSoupというものを使ってみようかと前回の記事でも触れていました。 今回は、実際にTagSoupを使ってHTMLの読み込み

  • 1