ダウンロード等 extbody-0.1.1.tar.gz(右クリックで保存) ライセンスは、Apacheライセンスv2.0なので自己責任でご利用ください。 (上記ファイルはMercurialリポジトリのcloneにもなっています。) 動作に必要な環境 Python2.5 feedparser chardet また、内部でppkfを使用しております。(extbodyに内蔵しております。) インストール feedparserと、chardetをインストールしておきます。 以上が準備できれば、extbodyも以... > このページを見る
最終更新時間:
2007年07月30日01時44分
みんなのブックマーク 人気(0) 新着
- "いくつもの経験則を組み合わせた抽出方法によって、80%程度の正解率で抽出できます。"
- EFT 的に動作する Plagger プラギンほしす。
- 「Blogのページや、ニュース記事のページから、本文を含む領域のHTMLを抽出します。」
- 本文を含む領域のHTMLを抽出
- Blogのページや、ニュース記事のページから、本文を含む領域のHTMLを抽出します。いくつもの経験則を組み合わせた抽出方法によって、80%程度の正解率で抽出できます。
- BLOGやニュースから本文領域を抽出するツール。正解率80%程度








