タグ

@itとwebに関するMasayukiのブックマーク (2)

  • 進化する“Webスクレイピング”技術の世界 ― @IT

    2007/02/20 WebサービスAPIRSSフィードを使って複数サイトのサービスや情報をマッシュアップ――。これはWeb2.0が包含するいくつかの概念のうち、最も重要なものの1つだ。Amazon.comやGoogleYahoo!楽天といった大手Webサイトは、RESTやSOAPを用いたAPIを公開しており、さまざまなサービス提供者や個人がAPIを通して各種サービスを利用している。その一方、世の中のWebサイトの大多数はWeb1.0的なHTMLCGIフォームしか提供していないのが現実だ。こうした背景からWeb1.0サイトから構造化されたデータを引っ張り出す“Webスクレイピング技術が急速に発展してきているようだ。 HTMLをXML化し、XPathで関連データだけを抽出 例えば価格情報サイトでは製品名から価格が簡単に調べられるが、Webサーバから提供されるのは、製品名や価格にレ

  • @IT:ネットワークコラム:国内の総合辞書検索屋への挑戦者、ウェブリオとは?

    数回にわたる国内のWeb2.0企業シリーズ。第3弾の今回は、100を超える専門辞書の集合体、Weblio。100を超える専門辞書の集合体、Weblio。既存辞書を登録していくという方針は、ユーザー参加型のCGM辞書を超えられるか?(編集部) 連載目次 総合検索辞書サイト、ウェブリオオフィスの熱気 このコラムでは何回かに分けて、Web 2.0周辺の話題をお届けしている(参照記事:Webちらし、国産RSSリーダーと人工知能化の野望、API公開のずいぶん前からすでにWeb2.0でした)。@ITのようなオンラインメディアで何かを取り上げるのであれば、いままさに巣立とうとしている面白いサービスを応援したいという気持ちを持ちつつ、日々ネットをウオッチしている。 そんな中、「バーチカル検索」「マッシュアップ」「ロングテール」といった、最近のトレンドを示す言葉がポンポンと気持ちよく当てはまる格好の取材対象

    @IT:ネットワークコラム:国内の総合辞書検索屋への挑戦者、ウェブリオとは?
    Masayuki
    Masayuki 2006/08/13
    Weblio 辞書を運営するウェブリオ株式会社のレポート。
  • 1