タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

Programmingとhtmlとsoftwareに関するjjzakのブックマーク (2)

  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ

    jjzak
    jjzak 2007/09/04
    Webstemmer はニュースサイトから記事本文と記事のタイトルをプレインテキスト形式で 自動的に抽出するソフトウェアです
  • HTMLリアルタイム編集(ブックマークレット) @ ZEROBASE BLOG

    quickedit by ZEROBASE'+b.innerHTML.replace(/&/g,'&').replace(//g,'>').replace(/"/g,'"')+'');var t=x.getElementById('t');t.onchange=t.onkeyup=function(){b.innerHTML=t.value;};}())">[HTML編集] このリンクをブラウザのブックマークバーにドラッグ&ドロップするなどにより登録してください。 使い方 編集したいページで上記ブックマークレットを実行します。ためしに上記リンクをクリックしてみてください。 テキストエリア内にHTMLが表示されますので、それを編集してください。変更が即座に反映され、もとのウィンドウが書き換わります。 書き換えているのは、ブラウザのメモリ上のHTMLです。サーバには何の影響もありません。 便利

  • 1