snaflotのブックマーク / 2012年6月29日

snaflot id:snaflot

2012年6月29日のブックマーク (6件)

クローラを作る技術と設計 (毎週のハンズオン勉強会資料)
仕事の手離れを良くする手段としての、静的検査のあるテンプレートエンジン (YATT::Lite talk at 2014 テンプレートエンジンNight)Hiroaki KOBAYASHI
snaflot 2012/06/29
スクレイピング

正規表現
リンク
誰でもスクレイピング！DOM要素を引っこ抜くSimple HTML Dom
WEBサイトは著作権で守られています。許可無く勝手に人様のサイトから情報だけ抜き出して自分のサイト上に公開することは出来ません。この著作権の問題には十分注意してください。スクレイピング便利クラス　Simple HTML Dom スクレイピングの方法はいくつか存在するのがですが、私はSimple HTML Domを好んで使っています。色々調べた結果、個人的にはこれが一番使い易いと思いました。サイトからダウンロードし、simplehtmldom_1_5フォルダをスクレイピングを実行したいサーバーにアップして、simple_html_dom.phpを呼び出すだけで準備は完了します。引っこ抜きの指定が実はCSSそっくり！だからWEBデザイナーにも！簡単ですが、データの引っこ抜き方です。『ここを引っこ抜きたい！』という部分を指定します。下記の赤字部分に注目。引っこ抜きたい(スクレイピングし
snaflot 2012/06/29
スクレイピング

php
リンク
PHP Simple HTML DOM Parserの使用方法 - Webスクレイピングライブラリ
snaflot 2012/06/29
スクレイピング

php
リンク
ScraperWikiをためしてみよう | ScraperWiki Data Blog
Guest post by Makoto Inoue, a Japanese ScraperWiki user はじめにみなさんスクレイプ（Scrape）という単語はご存知でしょうか？ウェッブページから特定のデータを引っこ抜く作業のことをスクレイピング（Scraping）と呼びます。昨今のホームページではデータを簡単に提供するためのAPI（Application Programming Interface）というしくみが多いので「なんで今更そんなの必要なの」と思われる方>も多いかもしれません。しかしながら前回起きた東日本大地震の際、地震や電力の速報や、各地の被害状況を把握するために必要な政府の統計情報などがAPIとして提供されておらず、開発者の中には自分でスクレイパー（Scraper）用のプログラムを書いた人も多いのではないのでしょうか？　ただそういった多くの開発者の善意でつくられた
snaflot 2012/06/29
スクレイピング
リンク
Members of the House of Representatives of Japan
ScraperWiki Classic is now read-only. But don’t worry! You can transfer this scraper to Morph.io if you want to continue editing it. Transfer to Morph.io
snaflot 2012/06/29
リンク
スクレイピングするなら ScraperWiki 使うといいよ - ヤルキデナイズドだった
Web ページからデータを抽出してデータベースに突っ込むことに性的興奮を覚えるみなさん、 ScraperWiki 使うとキモチイイですよ。以上です。そうではないみなさんには少々の説明が必要かと思いますので少々書きます。 ScraperWiki はスクレーパ（Web ページをスクレイピングするスクリプト）とスクレイピングで得られたデータを共有しようぜっという Web サービスです。Wiki と名が付いていますが Wiki っぽいページ構成になってるわけではなく、スクレーパやデータを誰でも編集できるようにして成果を共有するという理念が Wiki と共通しているのが由来みたいです。 ScraperWiki を使うとスクレーパを作るのがラクになります： Web ベースのエディタでスクレーパを書き、その場で実行できる PHP、 Python または Ruby が使える（HTML パーサなどのモジュ
snaflot 2012/06/29
スクレイピング
リンク
- 2012年6月30日
- 2012年6月29日
- 2012年6月28日