(閉じる)

タグ :

コンピュータ・IT 51 users このエントリーをはてなブックマークに追加

extbody -- Blog&News本文領域抽出ツール

ダウンロード等 extbody-0.1.1.tar.gz(右クリックで保存) ライセンスは、Apacheライセンスv2.0なので自己責任でご利用ください。 (上記ファイルMercurialリポジトリのcloneにもなっています。) 動作に必要な環境 Python2.5 feedparser chardet また、内部でppkfを使用しております。(extbodyに内蔵しております。) インストール feedparserと、chardetをインストールしておきます。 以上が準備できれば、extbodyも以... > このページを見る

最終更新時間: 2007年07月30日01時44分
▼ブログで紹介する

みんなのブックマーク 人気(0) 新着

  • "いくつもの経験則を組み合わせた抽出方法によって、80%程度の正解率で抽出できます。" 2008/05/10
  • EFT 的に動作する Plagger プラギンほしす。 2007/08/13
  • 「Blogのページや、ニュース記事のページから、本文を含む領域のHTMLを抽出します。」 2007/08/01
  • 本文を含む領域のHTMLを抽出 2007/07/31
  • Blogのページや、ニュース記事のページから、本文を含む領域のHTMLを抽出します。いくつもの経験則を組み合わせた抽出方法によって、80%程度の正解率で抽出できます。 2007/07/31
  • BLOGやニュースから本文領域を抽出するツール。正解率80%程度 2007/07/30

このブックマーク一覧を非公開にするには?

はてなブックマークはオンラインでブックマークを管理・共有できる無料サービス。自宅、職場、外出先、どこからでも同じブックマークにアクセスできます。ユーザーはみんなでブックマークを共有して効率良く情報収集しています。あなたもはてなブックマークを始めてみませんか?

このエントリーを含むエントリー(1)

このエントリーを含む日記(1)