Haskellでウェブサイトのスクレイピングをしたくていろいろ調べていた。 HaskellのHTML/XML パッケージは乱立気味*1であるが、WebフレームワークのYesodで採用されている以下のパッケージが良さそうだ。Conduitという効率的な新しいIOベースで(このところよく知らないが、http://tanakh.jp/posts/2012-07-01-conduit-0.5.htmlとかhttp://d.hatena.ne.jp/kazu-yamamoto/20120113/1326446266とかの解説が良さそう)、また探索用の関数も一通りそろっている。 読み込み xml-conduit html-conduit 書き出し blaze-html (追記:CSSセレクタでスクレイピングの出来るdom-selectorライブラリを作った。http://hackage.haskell