タグ

rdfに関するtadasatoのブックマーク (2)

  • rubyでCinii詳細表示画面のrdfをパースする(libxmlで)

    相互貸借というサービスを作ったと以前書いたのですが、 その際に、どうやってCiniiの詳細表示画面(論文個別のページ)のrdfを パースしていたかを書いときます。 Ciniiでは、詳細表示画面のURL(http://ci.nii.ac.jp/naid/110004744915)に、 ”/rdf”と追加するだけで書誌情報をrdfとして提供してくれるapiがあります。 これを利用しているのですが、rubyでxmlをパースする標準ライブラリのrexmlや、 rssの読み込み・生成に使うRSS Parserでは上手いことパース出来ませんでした。 (原因は良く分かってないのですが、ciniiのrdfは、書誌一つだけの情報を提供するので、 channel要素がないからかなー?とか勝手に想像しています。) というわけで、Libxmlを使うことにします。 libxmlのインストール時には、libxml2-

  • 第11章 RSS, Atomデータを利用する:RSS 1.0 (RDF)を読み込む

    この章では、多くのサイトで配信されているRSSを利用して見出し、リンク、記事内容の要約を表示させてみます。 RSSに関しては読み込まれた内容に対して一括して検索して結果を表示するという処理を第六章の六で行いました。RSSに関しては詳解RSSというがありますし、サイトで検索すればRSSフォーマットに関する情報が得られます。 一口にRSSといっても簡単ではありません。というのもフォーマットがいくつかあり、それぞれ別の団体が作成していたりするため、互換性などがなかったりします。現在、配布されているRSSには以下の3つがあります。 RSS 1.0 (RDF) 【日で多く利用】 RSS 2.0 (RSS 0.9x)【米国で多く利用】 Atom【ブログで多く利用】 RSS 0.9を改良したものがRSS 2.0です。1.0ではありません。RSS 1.0はRDFフォーマットで別個です。フォーマットが乱

  • 1