タグ

2011年9月21日のブックマーク (3件)

  • WinHTTP ライブラリで Web スクレイピング(1)~ GET 編~

    概要 Web から情報を取得したいというニーズは、いまや当たり前のものになりました。 対象サイトが Web API を提供している場合、話は簡単です。しかし Web API を提供しているサイトばかりではありません。というより、数で言うなら Web API を提供していないサイトの方が圧倒的多数です。そんなサイトの中にほしい情報があった場合は、否応なく Web ページを直接取得して情報を解析・抽出する必要があります。 原始的と言うか地道と言うか、とにかくこのベタなやり方を称して「Web スクレイピング」(文脈によっては単に「スクレイピング」)と呼びます(海外では Web harvesting と呼ぶ場合も多いですが、なぜか日ではこっちはほとんど用いられないようです)。 Access VBA で Web スクレイピングを行う方法については、サイトにすでに関連トピックが二つ存在します。 W

  • 業務システムに組み込みたい。PHPからExcelファイルを読み書きする·PHPExcel MOONGIFT

    PHPExcelExcelファイルの読み書きを行うPHPライブラリ。PDF/HTML出力にも対応。 PHPExcelPHP製のオープンソース・ソフトウェア。業務システムを開発していて必ず発生するのがExcelのような表形式ファイルの取り込みだ。大抵はCSVに変換してもらって取り込むだろう。だがユーザが変換を忘れてExcelを読み込ませてしまうことも度々だ。 PHPで出力できる さらにシステムから資料を出力する際にもCSVをダウンロードして手作業で修正して…という手間をユーザにとらせることになってしまう。そんな時代はもう古い、PHPExcelを使ってリッチなExcelファイルをそのままやり取りしよう。 PHPExcelExcel 2007をベースとし、5.0/95/97以降のファイル形式の読み込みにも対応している。Excel 2003のXMLフォーマットも扱える。さらにOpenOffi

  • "Against the day" Review

    ピンチョンの意地悪な新作 Thomas Pynchon, Against the Day (Penguin, 2007) (『一冊の』2007 年 9 月号 pp.26-7) 山形浩生 要約: 十九世紀末のシカゴ万博ではじまり、ウェスタン小説とアナキストの価値薬と、四元数とニコラテスラと、中央アジアのシャンバラ探索とリーマン・ゼータ仮説と飛行船少年冒険物語とツングースカ大爆発とをからめた得体の知れない収拾のつかない変な話。細部の深読みに喜びを見いだす人は大いに楽しめるだろうが、結局何だったんだ、という小説ではあって、読むヤツいるのか、という感じ。実は読者にイジワルしようとしてピンチョンが書いてるだけじゃないかとも思うのだが。 トマス・ピンチョンの新作が出たのはしばらく前のことなのだが……いったいこれをどうまとめていいものやら。もともと謎の作家として評価の高いピンチョンの各種小説は、そのほ