ドットインストール代表のライフハックブログ
以前からCPANで公開していたモジュールがあるんですが、日本語での解説ドキュメントがなかったのと、最近大幅にブラッシュアップしたので、せっかくなので紹介記事を書きます。 HTML::Feature - Extract Feature Sentences From HTML Documents 「えいちてぃえむえる::ふぃーちゃー」と読みます。 ブログやニュース記事など様々なHTML文書から「重要部分」を推測して抽出してくれる perl モジュールです。 「重要部分」とはいわゆる「本文」のことですね。本文抽出とか焦点抽出とか色々な言い方があるかと思いますが、まぁ要するに特徴的な部分を推測して抽出するわけです。 どういうものか。 例えばブログ記事からヘッダーやフッター、その他のナビゲーションブロックを除いた「記事らしき部分」だけを切り取りたい、とします。 ぱっと思いつくのは「特定のコメントタグ
This domain may be for sale!
「保険かけて死ねよ!」と土下座社長を取囲み嘲笑 八王子自動車教習所閉鎖説明会での私刑動画がアップされる 1 名前: トビウオ(東京都) 投稿日:2008/11/04(火) 14:33:11.43 ID:j+WfY6rX ?PLT ※動画: 土下座中に囲まれた社長、「顔を上げて」と引っぱり起こされる。 「どうなさるんですか?」「お忙しい中、ネイルする時間あったんだもんねぇ?」「そんなキレイなピアスつけて」「おめかしして」 と女性。土下座姿をケータイで撮影。一同爆笑。 http://jp.youtube.com/watch?v=wgmiWbcE9wY 【債権者説明会の様子】 スーツ姿に扮した社長等が債権者説明会に登場。 ↓ 「土下座しろ!」「すれば免許を諦めていただけるんですね」などの会話を経て土下座 ↓ 土下座している傍の床を叩かれ、「おい」「どーすんの!」などと罵られる。 ↓ 壇上に上がっ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く