タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

scrapingに関するxiaodongのブックマーク (4)

  • 学会名鑑をハックしてみる - Katachi

    今回のテーマ 学会名鑑というDBがあります。Web APIはありません。GETではなくPOSTというやり方で検索時のデータを渡しています。このDBから自由にデータを取り出して遊んでみようと思います。某所で地味に没ってしまった企画(?)ですが、せっかくなのでリードテックラボでそれを記録して書き留めておきたいと思います。 学会名鑑、てなに? 学会を調べることができるDBです。 http://gakkai.jst.go.jp/gakkai/control/toppage.jsp 検索窓に検索ワードを入れるタイプの検索と、「詳細な検索」ボタンを押すと詳細画面にフィールドを指定して検索する2種類の検索方法があります。詳細検索では以下のキーワードで検索できます。 分野 機関名(学会名) 設立 住所 代表者 フリーワード 検索ウィンドウが空のまんまで検索できるので検索してみます。[1918件]とでました

    学会名鑑をハックしてみる - Katachi
  • ScraperWikiをつかってみた - Katachi

    はじめに もうずいぶん前のネタになりますが、2011年10月にCode4Lib Journalというところに、 「Controlled Terms or Free Terms? A JavaScript Library to Utilize Subject Headings and Thesauri on the Web」 という記事をのせてもらいました。 記事の内容としては、検索やタギングの場面で「各種キーワードセット(ここでは典拠や件名標目)」を活用してみようよという話で、その足がかりとして「covo.js」というJavaScriptライブラリを作ってその「各種キーワードセット」を簡単に呼び出せるようにするところからはじめてみました。実際にはじめてみると「各種キーワードセット」がウェブ上にあったりなかったり、あっても使いづらかったりするので、記事中では「各種キーワードセット」の状態を下

    ScraperWikiをつかってみた - Katachi
  • ScraperWikiをためしてみよう | ScraperWiki Data Blog

    Guest post by Makoto Inoue, a Japanese ScraperWiki user はじめに みなさんスクレイプ(Scrape)という単語はご存知でしょうか? ウェッブページから特定のデータを引っこ抜く作業のことをスクレイピングScraping)と呼びます。 昨今のホームページではデータを簡単に提供するためのAPI(Application Programming Interface)というしくみが多いので「なんで今更そんなの必要なの」と思われる方>も多いかもしれません。しかしながら前回起きた東日大地震の際、地震や電力の速報や、各地の被害状況を把握するために必要な政府の統計情報などがAPIとして提供されておらず、開発者の中には自分でスクレイパー(Scraper)用のプログラムを書いた人も多いのではないのでしょうか? ただそういった多くの開発者の善意でつくられた

  • スクレイピングするなら ScraperWiki 使うといいよ - ヤルキデナイズドだった

    Web ページからデータを抽出してデータベースに突っ込むことに性的興奮を覚えるみなさん、 ScraperWiki 使うとキモチイイですよ。以上です。 そうではないみなさんには少々の説明が必要かと思いますので少々書きます。 ScraperWiki はスクレーパ(Web ページをスクレイピングするスクリプト)とスクレイピングで得られたデータを共有しようぜっという Web サービスです。Wiki と名が付いていますが Wiki っぽいページ構成になってるわけではなく、スクレーパやデータを誰でも編集できるようにして成果を共有するという理念が Wiki と共通しているのが由来みたいです。 ScraperWiki を使うとスクレーパを作るのがラクになります: Web ベースのエディタでスクレーパを書き、その場で実行できる PHPPython または Ruby が使える(HTML パーサなどのモジュ

    スクレイピングするなら ScraperWiki 使うといいよ - ヤルキデナイズドだった
  • 1