運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します。個別にライセンスが設定されている記事等はそのライセンスに従います。
スクレイピングをやったことがあるひとならばわかると思うけど、スクレイピングはとてもつまらない作業だ。 HTMLの中から抜き出したい部分を見つけて、その周辺にある特徴的な部分に着目して正規表現を書いたりして抜き出す。あるいはHTMLからDOMを生成して特定のクラスがついているエレメントを抜き出したりする。HTMLをXHTMLに整形、変換してXPathで抜き出す方法もある。どの方法もやることは単純で簡単なことだけれど、極めてめんどくさい。 そういうものだと思って数年間過ごしてきたけれど、去年の夏に出てきた Dapper: The Data Mapper は、そんな退屈な常識をモダーンなajaxでもって吹き飛ばした。もしDapperがどんなのなのか知らなかったら、ちょっと長くてはじめ退屈なんだけど デモムービー を見てみてください。 Dapperが教えてくれたことは、スクレイピングなんて、欲し
あのCPUを作っているIntelが新しくマッシュアップツールを発表するらしいというのを Mashups: Mashup Maker Smackdown で知ったのでそのことを書くつもりで書き始めたら長くなったのでまた次回書きます。さいきん顔認識ができることで有名になったOpenCV もIntelが作っているし、Intelファンな自分としてはうれしいです。 Mashable!はいろんなサービスを全部ひとくくりに"マッシュアップツール"と呼んでいますが、マッシュアップツールには大きく分けて3つあって、はっきり区別しておくのは重要だと思うのでそこを整理したいと思います。 マッシュアップツールの分類 マッシュアップツールと呼ばれているサービスの持つ要素は3つに分けられます。 データを取り出すためのもの マッシュアップ対象にしたいサービスがXMLのように意味のある構造化されたデータを提供してくれるな
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く