タグ

ブックマーク / www.kantenna.com (2)

  • [PHP] スクレイピング 基本|WEBプログラム覚書

    Tidyは、「Tidy HTML clean and repair utility」用のバインディングで、 HTML文書の誤りを直すだけでなく、操作することやドキュメントツリーを操作することも可能となります。 とありますが、目的のノードを取得するのはhtml、bodyから辿っていかないとダメっぽい?ので面倒です。なのでtidyではぶっ壊れてるかもしれないhtml/xmlを修正して、パースは別のライブラリ使ったほうが便利です。 お手軽なのはSimpleXMLでしょうか。xpathも利用できるし。ただxpathは重い処理になるとのことですが。。。 またamp;が存在するとどういうわけかSimpleXMLが解釈できないため、 tidyのオプションでquote-nbspをfalseに指定するも下記掲示板の記述にあるように動かず。一体どういうことなんだ?? まぁ仕方ないのでereg_replaceで

  • [PHP]MySQLを利用した画像の保存と出力|WEBプログラム覚書

    HOME>WEBプログラム覚書>[PHP]MySQLを利用した画像の保存と出力 [PHP]MySQLを利用した画像の保存と出力 PHPで画像を取得してMySQLに保存、そしてMySQLからデータを取得して表示させる方法を そろそろ書かないとまずい気がしたので書いておきます。 画像をデータベースに保存するのには、とても重要な意味があります。 その前に、まずは仕組みから。 仕組み 特に難しいことはないのですが、意外と知らない人も多いのではないでしょうか? 僕もPHPやる前は知りませんでしたw 上図が画像ファイルにアクセスして表示されるまでの簡単な流れです。 まぁこの流れ自体は別にどうでもよくて、今回もっとも重要になるのがレスポンスヘッダのcontent-typeです。 content-typeに絡むWEBサーバとブラウザの役割は、 WEBサーバ 拡張子に応じて適切なcontent-typeをh

    metazy
    metazy 2010/11/01
    取得 保存
  • 1