タグ

ブックマーク / iscream.servehttp.com (1)

  • ISCream » Blog Archive » [PHP]簡易クローラを作成してみよう!

    はい、こんばんわ。たまねぎです。 約二ヶ月ぶりの更新ですね。 今日はクローラもどきを作ってみようかと思います。 クローラ (Crawler) とは、ウェブ上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラムである。「ボット(Bot)」、「スパイダー」、「ロボット」などとも呼ばれる。 wikipedia引用 というわけで、PHPで作っていきます! HTML情報の取得方法は色々とあるのですが、今回は外部ライブラリなど使用せずに作っていきます。 作る前に要件定義的なもの。 入力フォームと送信ボタンを作成し、入力フォームにURLを入力することで、URL先の情報を取得する。 取得する情報はmeta情報(description,keyword,author)とtitle情報。 取得したデータはCSVファイルでダウンロードさせる。 では、ソースコード まずはindex.php(入力 

  • 1