タグ

ブックマーク / okumuralab.org/~okumura (1)

  • SpringerLinkでISBNから書誌情報を得る

    ~/ebooks というディレクトリに bok%3A…….pdf というファイルがいくつか入っている。この …… の部分がISBNである。まずそれを抽出する: names = dir("~/ebooks", "^bok.*\\.pdf$") isbns = sub("^bok%3A(.*)\\.pdf", "\\1", names) 次に,ISBNを一つ与えて,SpringerLinkから書名と著者名を取ってくる関数を書く: library(xml2) foo = function(isbn) { url = paste0("http://link.springer.com/book/10.1007/", isbn) x = read_html(url) title = xml_text(xml_find_all(x, "//h1[@id='title']")) authors = uni

    xiangze
    xiangze 2015/12/30
  • 1