タグ

CGIに関するtack07のブックマーク (2)

  • phpによるスクレイピング処理入門

    1. はじめに このサイトは php を利用したスクレイピング処理の具体的手法について記載されたサイトにしようと思っています。なので、あまり面白いサイトではありません。内容も偏重していることと思いますが、ご質問などがございましたら、りょーちまでご連絡ください。 1.1. スクレイピングとは スクレイピングの話しを始める前に、現在のWebサービスについて幾つか言及しておきます。 現在様々な会社が様々なWebサービスを展開しています。かなり昔、今よりWebサイトそのものが少ない頃の時代は、HTMLファイルを手動で作成することが殆どでした。しかし、現在はバックグラウンドにデータベースが存在し、データベースの内容を動的に表示し、ページを作成するようなサイトがかなり多くなっています。 さて、データベースを利用するメリットは何でしょうか? 幾つかの視点が挙げられると思います。 最も重要な点は、ひとつひ

  • 全文検索ソフト(Perl版)徹底比較

    [トップページ][Namazu(Perl版)設置ノウハウ][Namazu正規版インストール覚え書き] 日語全文検索エンジンソフトウエアにはさまざまな種類が公開されています。サーバーに負荷をかけず、大規模なサイトの検索に向くのはC言語で書かれたプログラムですが、コンパイルの必要がありますし、多くのプロバイダでtelnetを禁止している現状では個人のサイトに設置するのは難しいようです。 ここでは設置が比較的簡単なPerl版のスクリプトを取り上げます。個人の小規模サイトならこれで十分でしょう。ホームページに全文検索エンジンを設置したいと考えている人の参考になれば幸いです。 (いちいち読んでいる暇がない方は、結論をどうぞ)。 比較するのは下記の18のスクリプトです(かっこ内は作者のホームページ)。 【grep】 1.WASearch(鷲崎弘宜のページ) 2.WwwSearch(とほほの

  • 1