こんにちは、バーブ佐竹です(嘘です)。 りょーちのこのサイトではphpによるプログラムを幾つか紹介したりしているのですが、一発モノが多く、体型立てて説明することがあまりないので、ちょいと説明用のサイトを作ってみた。 で、第1回目はいきなりハードル高いですが「スクレイピング処理」について書いてみることにした。 このサイトでも「スクレイピング」という言葉はたまに利用しているのだが、もう一度整理してみると、APIが提供されていないWebサービスもバックグラウンドにデータベースなどがあるはず。で、そのWebサービスはデータベースから読み込んで機械的にデータを「あるパターン」に流し込んでサイトを作成しているであろう。 なので、目に見える部分(表示されているHTMLファイル)を解析し、必要なデータのみを取得して、自前のサーバ側で再度加工して、提供するようなことができると思われる。このことを「スクレイピ