2. ふるかわだいすけ フリーランスWEBエンジニア http://mogya.com/ http://mogya com/ Twitter: @mogya 自己紹介
Web APIが公開されてなくても、動的にマッシュアップすることが可能だ。便利に使える“まとめサイト”を、各種ツールで動的に構築しよう。 すべて表示 新着記事 関連記事 まとめサイト2.0: 2008年、Webは文字列解析で変わっていく オルタナティブ・ブログを例に挙げて“まとめサイト”を作るための手法を紹介してきたこの連載。最終回は、文字列解析の自動化からキーワードを抽出するための方法を紹介しよう。 (2007/12/28) まとめサイト2.0: 付加価値コンテンツとは――スクレイピングからグラフ化まで HTMLを解析し、スクレイピングしたデータを基にグラフ化を行う。遷移を把握するために有効なものとして、さまざまな応用が考えられるだろう。 (2007/12/21) まとめサイト2.0: スクレイピングで記事ランキングのグラフ化 「オルタナティブ・ブログ」で公開されている週間アクセスランキ
やっぱ jQuery 便利ですよ(*´・ω・)(・ω・`*)ネー セレクタ使って jQuery でダカダカやってると、DOM とか正規表現でネチネチやるのがバカらしくなっちゃいます。 と日頃から思ってたりしてまして、サーバサイド JavaScript がメインストリームになって、jQuery でウェブアプリをコーディングできれば超ラクできるかもと期待しています。 で、先日サーバサイドJavaScriptとjQueryでスクレイピングという記事をうpったところ、やっぱ Rhino じゃなくて node.js がえーんよ(´・ω・`)というコメントを頂きましたので、node.js と jQuery でサーバサイド JavaScript スクレイピングしてみることにしました。 今回は node.js ですので、単にスクレイピングする(コマンドラインから実行する)スクリプトだけじゃなくて、スクレイ
どんなサイトでも、マッシュアップすることができる。APIが公開されていなくてもいい。新たなまとめサイトを構築し、情報付加価値を高めるための手法を解説しよう。 さまざまなコンテンツを組み合わせて、好みに合ったページ(サービス)を作り上げる「マッシュアップ」。これの最たるものは、コンテンツ提供者が公開する「WebAPI」の組み合わせで実現するものだ。 しかし、利用する仕様を整備して、効果的なデータだけをメータデータ配信するWebAPIは、まだそれほど普及していない。つまりマッシュアップというキーワードから流行っている兆しはあっても、対象として使うことができるものは、意外と少ない。思い出してほしい。 このような状況を打開するのが、HTMLコンテンツを抜き出して加工する「スクレイピング(scraping)」という手法だ。 このオンライン・ムックPlus「まとめサイト2.0」では、例として「ITme
こんにちは、小川です。 今回はPHP製のスクレイピングライブラリ「Goutte」を紹介します。 Goutteの作者はSymfonyプロジェクトのリーダーを務めるFabien Potencier氏です。 Goutteの利用にはPHP 5.3が必須です。また、GoutteはSymfony2のコンポーネントやZend Frameworkの一部のライブラリを利用しています。 まずはインストールを行います。GitHubのリポジトリをクローンします。 実際にスクレイピング処理を記述するscrape.phpを作成します。 Goutteは単一のPharアーカイブにまとめられています。 このPharアーカイブを読み込むだけでGoutteが利用可能です。読み込みはPHPファイルと同様、requireで行います。 (PHP: Phar - Manual) 先ほどクローンしたGoutteディレクトリの直下にgou
「安く便利な航空券を入手する」ことには、私自身もかなりこだわっていて、出張前にパソコンに向かってウェブサイトの時刻表やチケット情報を複数同時に眺めつつ、あれこれ考えるのが常だ。 「うーん、香港からの便は、朝早くかあるいは深夜便しかないな、困った・・・」 「いやちょっと待てよ! 前日の晩は香港ではなく、マカオに泊まればどうだ? やっぱり!」 「次の日ちょうどいい時間のフライトがある。マカオはホテル代も安いから、香港からのフェリー代を考えてもお釣りがくる!」 「広州~深セン間に新しく開通した高速鉄道を使うのはどうだ? 35分で行けるぞ!」 などと、最適解を発見してはちょっぴり悦に入るのが、海外出張前の私にとって、ある種の“儀式”のようになっている。 本人は西村京太郎だと思っているのだが、周りには“ちょっとインターナショナルな鉄ちゃん”にしか映っていないようなのが残念だ。 さて、本論に戻るが、「
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く