ottonoveのブックマーク - はてなブックマーク

ブックマーク / oggata.hatenadiary.org (1)

ExtractContentで本文抽出を試す。 - oggataの日記
http://d.hatena.ne.jp/naoya/20090911 ここで読んだはてなの本文抽出で使用されているという ExtractContent ＷＥＢの本文をperlを使って、抜き出すライブラリらしい。これまで自分のサイトなどでは、simple_html_dom.php を使って、HTMLをパースしたものを正規表現で色々やっていたので、こんな便利なものがあるなら！使ってみたい！とさっそく試す。 http://perl-mongers.org/2008/10/extract-content-from-html.html 初perlなので、cpanなど使い慣れず、四苦八苦したけど最終的には下記手順で無事出来ました。 1.CPANのインストール http://y-kit.jp/saba/xp/cpan.htm 1-1.cpanとコマンドを打つ #cpan 1-1下記のような質問
ottonove 2016/08/04
あとで読む
リンク
1

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx