先日書いたように、スクレイピングにはWebViewが使えるのだが、WebViewからjavascriptのメソッドを呼ぶ際にはどうしてもメインスレッドとは別スレッドで非同期で動作させる必要があるため、スクレイピング処理を外部からメソッドのように呼び出すことはできない。(スレッドをポーリングなどで監視したり、サービスからのコールバックを受けるようにすれば可能かもしれないが、非同期であることに変わりはない) となると、やはり真っ当にHTMLを順にパースしていくのが良かろうと思ったが、そもそも適当なHTMLパーサが無いのがWebViewを使う大きな理由の一つな訳で何を使うか悩む所だ。 Javaで使える比較的軽量なHTMLパーサといえば NekoHTML Tagsoup jTidy HtmlCleaner この辺か。一通り調べてみたが、結局Tagsoupを使用することにした。(次点はNekoHTM
![AndroidによるHTMLのパース - Kazzz's diary](https://cdn-ak-scissors.b.st-hatena.com/image/square/675f3e6548fa655036b984207f8b8ca23515f378/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2FK%2FKazzz%2F20100701%2F20100701185907.png)