Web サイトの本文抽出を PHP で行う | ソフトウェア開発の株式会社システムフレンド

テクノロジーカテゴリーの変更を依頼記事元:

www.systemfriend.co.jp

6 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Web サイトの本文抽出を PHP で行う | ソフトウェア開発の株式会社システムフレンド

こんにちは高橋です。ひさびさです。ぺちぺで検索エンジンや類似文書の提示エンジンなどを作成していた... こんにちは高橋です。ひさびさです。ぺちぺで検索エンジンや類似文書の提示エンジンなどを作成していたのですが、普通の文書ではなくサイト等の場合、タグやヘッダ情報、サイドバーリンクなどを対象に含めると精度がめちゃくちゃになるので、それを改善するために本文抽出プログラムを週末に実装しました。まだ一応動く程度です（いろいろと怪しいところがあるので、ごめんなさい）。 http://hakaselab.sakura.ne.jp/make/extractcontent/extractcontent.phps 下記のように利用します。 <?php require('./extractcontent.php'); list($body, $title) = extractcontent_analy(file_get_contents('http://www.example.com')); echo $titl

PHP
library

ブックマークしたユーザー

ayaniimi2132011/12/22
Pasta-K2010/01/12
milkya2009/12/29
alembert2009/12/29
deeeki2009/10/18

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx