タグ

+情報源と*自動化に関するshin_mtdのブックマーク (3)

  • まだ手で作る? これからは、マッシュアップで“まとめサイト”――まとめサイト2.0 - ITmedia エンタープライズ

    Web APIが公開されてなくても、動的にマッシュアップすることが可能だ。便利に使える“まとめサイト”を、各種ツールで動的に構築しよう。 すべて表示 新着記事 関連記事 まとめサイト2.0: 2008年、Webは文字列解析で変わっていく オルタナティブ・ブログを例に挙げて“まとめサイト”を作るための手法を紹介してきたこの連載。最終回は、文字列解析の自動化からキーワードを抽出するための方法を紹介しよう。 (2007/12/28) まとめサイト2.0: 付加価値コンテンツとは――スクレイピングからグラフ化まで HTMLを解析し、スクレイピングしたデータを基にグラフ化を行う。遷移を把握するために有効なものとして、さまざまな応用が考えられるだろう。 (2007/12/21) まとめサイト2.0: スクレイピングで記事ランキングのグラフ化 「オルタナティブ・ブログ」で公開されている週間アクセスランキ

  • スクレイピングで作る“まとめサイト”

    どんなサイトでも、マッシュアップすることができる。APIが公開されていなくてもいい。新たなまとめサイトを構築し、情報付加価値を高めるための手法を解説しよう。 さまざまなコンテンツを組み合わせて、好みに合ったページ(サービス)を作り上げる「マッシュアップ」。これの最たるものは、コンテンツ提供者が公開する「WebAPI」の組み合わせで実現するものだ。 しかし、利用する仕様を整備して、効果的なデータだけをメータデータ配信するWebAPIは、まだそれほど普及していない。つまりマッシュアップというキーワードから流行っている兆しはあっても、対象として使うことができるものは、意外と少ない。思い出してほしい。 このような状況を打開するのが、HTMLコンテンツを抜き出して加工する「スクレイピングscraping)」という手法だ。 このオンライン・ムックPlus「まとめサイト2.0」では、例として「ITme

    スクレイピングで作る“まとめサイト”
  • PHPで、今話題のTwitterのAPIバージョン1.1を利用する方法(ソース付き)

    コンテンツを自動生成する場合に便利な、外部サービスのAPIRSSCSVからXMLまでを紹介します。外部データを利用することでSEO効果を格段に高めることが可能です。 はじめに 外部サイトのWEB-APIRSSを利用すれば、コンテンツを自分で作成しなくても、立派なコンテンツが自動生成できてしまいます。 ここに広告を貼れば、それだけで収入になってしまう魅力的なやり方ですね。 しかし、そんなやり方が横行し、検索エンジン側もすかさず対応。今ではもう、APIからの単純な転載では稼げません。 むしろGoogleからページランクを下げられる要因になるでしょう。 今稼ぐのに求められているのは、”オリジナルコンテンツ”です。 しかし、ただ単純に外部データを転載するのはNGでも、 そこにオリジナリティがあれば、話は別です。 例えば、 ・特定の分野に特化して外部データを利用する ・2つ以上のAPIを組み合

  • 1