タグ

Softwareとprogramに関するIGA-OSのブックマーク (3)

  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ

    IGA-OS
    IGA-OS 2007/09/14
    WEBページから本文とタイトルを抽出するプログラム。クローラー
  • 米Yahoo!、マッシュアップサービスの「Yahoo! Pipes」をスタート

    Yahoo!は2月8日、Web上の各種データをマッシュアップしてカスタマイズされたWebサービスを構築するビジュアルツール「Yahoo! Pipes」を公開した。アクセスが予想を上回ったために一時ダウンしていたが、12時現在稼働している。 米Yahoo!のIDがあれば手軽に独自サービスを作ることが可能となるこのサービスは、UNIXのpipe機能からヒントを得て作られた。各種ツールをビジュアルにつなげて必要な項目を入力するだけでマッシュアップが可能になる。 「フィードをリミックスして新しいデータマッシュアップを構築することを、ビジュアルプログラミング環境で可能とする」とYahoo!では説明している。 関連記事 Yahoo!検索とLiveガジェットのマッシュアップ AJAXを追い風に、さまざまなサービスをWeb上で融合させるマッシュアップがはやっている。MSのLiveガジェットは、さまざまな

    米Yahoo!、マッシュアップサービスの「Yahoo! Pipes」をスタート
    IGA-OS
    IGA-OS 2007/02/09
    興味あり!!
  • すぺたぐ |

    みなさんこんにちは。今回は『かぐや様は告らせたい?』のアニメ第9話の感想・ネタバレを書いていきます。まだ視聴していない方はご注意ください。 前話では体育祭のことに触れていましたね。今回はその体育祭が中心となっている物語で...

  • 1