[B! Programming][library][html] jjzakのブックマーク

jjzak id:jjzak

Programmingとlibraryとhtmlに関するjjzakのブックマーク (6)

HTML5.JP - 次世代HTML標準 HTML5情報サイト
HTML5.JP は、HTML5 の国内での普及を目指し、2007 年に個人プロジェクトとして運営が開始されました。2019 年現在、すでに HTML5 は当たり前のように活用され、多くの情報がネットから入手することができるようになりました。当サイトの役割は終えたことに加え、当サイトの更新もままならず情報も古いままであったことから、当サイトを閉鎖することにいたしました。これまで当サイトをご支援頂きました皆様には心より御礼申し上げます。 2019 年 8 月 15 日管理人より
jjzak 2009/06/22
programming

tutorial

javascript

web

reference

library

html

document
リンク
nokogiri Documentation
nokogiri.rubyforge.org/ github.com/tenderlove/nokogiri/wikis github.com/tenderlove/nokogiri/tree/master rubyforge.org/mailman/listinfo/nokogiri-talk nokogiri.lighthouseapp.com/projects/19607-nokogiri/overview DESCRIPTION: Nokogiri (鋸) is an HTML, XML, SAX, and Reader parser. FEATURES: XPath support for document searching CSS3 selector support for document searching XML/HTML builder Drop in replace
jjzak 2009/02/25
programming

ruby

tools

rails

reference

library

parser

html

xml

xpath
リンク
neilvandyke.org - HtmlPrag
HtmlPrag provides permissive HTML parsing and em itting capability to Scheme programs. The parser is useful for software agent extraction of information from Web pages, for programmatically transf orming HTML files, and for implementing interactive Web browsers. HtmlPrag em its "SHTML," which is an encoding of HTML in SXML, so that conventional HTML may be processed with XML tools such as SXPath. Lik
jjzak 2008/03/21
schemeのhtmlパーサ

html

library

parser

programming

scheme
リンク
Webstemmer（クローラーツール）
日本語サイトでは、具体的な性能は測定していませんが、以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞日刊スポーツ信濃毎日新聞 livedoor ニュース使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。取得したページのレイアウトを学習する。別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから本文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。ひとたびサイトのレイアウトを学習してしまえば、あとはレイアウトが大きく変更さ
jjzak 2007/09/04
Webstemmer はニュースサイトから記事本文と記事のタイトルをプレインテキスト形式で自動的に抽出するソフトウェアです

html

opensource

parser

python

software

web

programming

algorithm

library
リンク
Greenbear Laboratory - Hpricot Showcase-Ja
GitHubindexHello source: index.md View on github | Report issue Generated by middleman 3.1.6. Powered by Ruby 2.2.2.
jjzak 2007/02/20
parser

programming

web

ruby

rails

library

html

reference
リンク
我的春秋: JavaScript ソースが HTML から消える日
［2006-06-10 付記］このエントリーは、2006-01-05 時点のもので情報が古くなってます。現時点で把握している最新情報を「続 JavaScript ソースが HTML から消える日」にアップしましたので、あわせてご参照ください。 Behaviour.js　― JavaScript ソースを (X)HTML から完全分離できるライブラリ昨日、職場の同僚の人がたまたま見つけた JavaScript ライブラリを教えていただたんですけど、これがもうびっくり！なんと、このライブラリがあれば、イベントハンドラーも含めて JavaScript ソースが (X)HTML の body 内から、ほぼ完全に分離できてしまいます！しかも、HTML 内で JavaScript 関数を適用する場所は、なんと JavaScript ソース内に CSS セレクタを書き込むことで指定！あまり日本では取
jjzak 2006/11/06
ajax

html

library

programming

tips

web

javascript
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx