相互貸借というサービスを作ったと以前書いたのですが、 その際に、どうやってCiniiの詳細表示画面(論文個別のページ)のrdfを パースしていたかを書いときます。 Ciniiでは、詳細表示画面のURL(http://ci.nii.ac.jp/naid/110004744915)に、 ”/rdf”と追加するだけで書誌情報をrdfとして提供してくれるapiがあります。 これを利用しているのですが、rubyでxmlをパースする標準ライブラリのrexmlや、 rssの読み込み・生成に使うRSS Parserでは上手いことパース出来ませんでした。 (原因は良く分かってないのですが、ciniiのrdfは、書誌一つだけの情報を提供するので、 channel要素がないからかなー?とか勝手に想像しています。) というわけで、Libxmlを使うことにします。 libxmlのインストール時には、libxml2-