2017年10月23日のブックマーク (2件)

  • PHPネイティブのDOMによるスクレイピング入門 - Qiita

    はじめに 淫夢要素はありません。 Simple HTML DOM Parser や Goutte の使い方は至る所で説明されていますが、PHPネイティブのDOMに関しての記事がかなり少ないので書いてみることにします。 ちなみに… Simple HTML DOM Parserは内部で何回も正規表現を使って全ての要素をパースするので、かなり遅いです。これ使うぐらいなら最初から自分で正規表現一で書いたほうがマシ。自分で正規表現を使って必要部分だけを抜き出す方法は、全ての方法の中で最も高速なので、正規表現が得意な人だったらこれでもいいと思います。 Goutteは内部でPHPネイティブのDOMを使ってます。PHPネイティブのDOMはDOMとして読ませる方法の中では最も高速なので良い方法をチョイスしていることになるのですが、そもそもGoutteに頼らなくてもそれなりに十分やっていけます。何より依存フ

    PHPネイティブのDOMによるスクレイピング入門 - Qiita
    perl48
    perl48 2017/10/23
    XpathでHTML解析。Windows環境でPyrhonのlxmlインストールうまくいかず、Perl使うかRubyにするか迷ってたけど、素のPHPでいける。好きだぜPHP。
  • CakePHP3.4で非推奨になったResponse::body()をResponse::withBody()に書き換えるときにややハマった

    非推奨を教えてくれるPhpStorm PhpStormというエディタを使い始めて1年ちょっとになるんですが、ほんとに優秀です。CakePHP3でシステム構築している際にも、非推奨のメソッドを教えてくれたりします。CakePHP4系に変わった時に、スムーズに移行できるように非推奨なやり方はできるだけ減らしておきたいですからね。 ↑こんな感じで、bodyメソッドが非推奨(deprecated)なのを教えてくれます。 非推奨メソッドは積極的に書き替えて行ってるんですが、ちょっとだけハマったので共有しておきます。 Response::body()をResponse::withBody()に単純に置き換えてもうまく動かない 先ほどの画像の所がまさにそうなんですが、Response::body()をResponse::withBody()に置き換えたかったんです。で、素直に $this->respon

    CakePHP3.4で非推奨になったResponse::body()をResponse::withBody()に書き換えるときにややハマった
    perl48
    perl48 2017/10/23
    PhpStormのおかげで、CakePHP3の非推奨メソッドのキャッチアップが早くなりました。エディタという巨人の肩に乗ってます。