2012年1月30日のブックマーク (2件)

  • c/c++で、htmlをパースする - void*

    c/c++用のHTML Parserの適当なライブラリを探していたところ、libxml2でもhtmlをパース出来ることを知りました。libxml2は、なかなか優れもので Push ModeによるChunkごとのパースも出来るようです。一括で読み込んで、パースという使い方ではなく、読み込みながら、パースしていくことが可能なようです。 ということで、実際にやってみました。 実装 curlを使用してダウンロードしながらパースをしてみました。少し長いです。SAXのコールバック用関数の定義が長くなっているためです。コールバック関数は、付属のhttp://svn.gnome.org/viewvc/libxml2/trunk/testHTML.c?view=markupから借用しています。 #include <stdio.h> #include <string.h> #include <iostream

    c/c++で、htmlをパースする - void*
    ka-ka_xyz
    ka-ka_xyz 2012/01/30
  • http://www.google.com/policies/

    ka-ka_xyz
    ka-ka_xyz 2012/01/30
    やな予感がする。凄くやな予感がするぜ。ググるさんが「プライバシーポリシー」って言ったときにはろくな事やらんからなあ