「海洋の情報」は、「海洋の健康診断表(海洋の総合情報)」に移転しました。ブラウザでお気に入りなどに登録している場合は、下記URLに変更をお願いします。 ./shindan/ 「海洋の情報」に掲載していた各種情報は、「海洋の健康診断表(海洋の総合情報)」のページの「海洋のデータバンク」のコーナーから閲覧できます。
「海洋の情報」は、「海洋の健康診断表(海洋の総合情報)」に移転しました。ブラウザでお気に入りなどに登録している場合は、下記URLに変更をお願いします。 ./shindan/ 「海洋の情報」に掲載していた各種情報は、「海洋の健康診断表(海洋の総合情報)」のページの「海洋のデータバンク」のコーナーから閲覧できます。
■ [ruby] RubyでHTMLとWebを操作するためのライブラリ、HpricotとWWW::Mechanize 今日は、RubyでWebサイトを解析するときに強い味方となるライブラリ、HpricotとWWW::Mechanizeを紹介します。 どちらも非常に強力なので、覚えておいて損はないよ! 以下ではまずHpricotでHTMLを解析・編集する方法について解説します。 次に、「はてなダイアリーの自動更新」を例にWWW::Mechanizeの使い方を解説します。 Hpricot HpricotはHTMLを解析するためのライブラリです。 例えば「あるページのリンクだけを全部抜き出したい」と思ったとき、どうしますか?scrAPIを使う?でもscrAPIはやっぱり ちょっと使いたいだけなのにパーザ(Scrape)用のクラスを定義するのが面倒なんだよね! Hpricotなら、たったこれだけで
2007/02/20 WebサービスのAPIやRSSフィードを使って複数サイトのサービスや情報をマッシュアップ――。これはWeb2.0が包含するいくつかの概念のうち、最も重要なものの1つだ。Amazon.comやGoogle、Yahoo!、楽天といった大手Webサイトは、RESTやSOAPを用いたAPIを公開しており、さまざまなサービス提供者や個人がAPIを通して各種サービスを利用している。その一方、世の中のWebサイトの大多数はWeb1.0的なHTMLやCGIフォームしか提供していないのが現実だ。こうした背景からWeb1.0サイトから構造化されたデータを引っ張り出す“Webスクレイピング”技術が急速に発展してきているようだ。 HTMLをXML化し、XPathで関連データだけを抽出 例えば価格情報サイトでは製品名から価格が簡単に調べられるが、Webサーバから提供されるのは、製品名や価格にレ
RSS翻訳のWebサービスあって良いと思うのに、どうも無さそう?。 RSS ⇒ 翻訳サイト ⇒ 翻訳RSSということできれば良いけど、WebAPIを公開してる翻訳サービスって意外に少ない。。WebserviceX.NET :: Web Servicesってとこが公開してるけど、SOAPだしちょい微妙&scrAPIを使ってみたい。ということで普通の翻訳サービスをスクレイピングして無理矢理やる。まずscrAPIをインストール gem install scrAPI gem install tidy scrAPIのチートシートがあったので参考にしつつ。もしこういうHTMLを読み込むとしたら <div.post_show> <h2><a href="http://hoge">タイトル~</a></h2> <h5>2006-12-01</h5> <div> 本文とか </div>
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く