タグ

parserに関するvista_macのブックマーク (1)

  • c/c++で、htmlをパースする - void*

    c/c++用のHTML Parserの適当なライブラリを探していたところ、libxml2でもhtmlをパース出来ることを知りました。libxml2は、なかなか優れもので Push ModeによるChunkごとのパースも出来るようです。一括で読み込んで、パースという使い方ではなく、読み込みながら、パースしていくことが可能なようです。 ということで、実際にやってみました。 実装 curlを使用してダウンロードしながらパースをしてみました。少し長いです。SAXのコールバック用関数の定義が長くなっているためです。コールバック関数は、付属のhttp://svn.gnome.org/viewvc/libxml2/trunk/testHTML.c?view=markupから借用しています。 #include <stdio.h> #include <string.h> #include <iostream

    c/c++で、htmlをパースする - void*
  • 1