タグ

2011年6月20日のブックマーク (2件)

  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ

  • 既存のコードをCoffeeScriptで書いたらどうなるか·Js2coffee MOONGIFT

    Js2coffeeはJavaScriptファイルをCoffeeScriptへ変換するnode.js用ライブラリ。 Js2coffeeはJavaScript/node.js製のオープンソース・ソフトウェア。ここ数ヶ月で注目を集めているのがCoffeeScriptだ。JavaScriptの癖のある書き方をせず、オブジェクト指向的な記法でプログラミングし、JavaScriptファイルを生成する言語だ。 生成されたコード 実際、どれくらい違うのかやってみないと分からないだけに躊躇してしまっているかもしれない。そこでまずは既存のコードをCoffeeScriptにするとどう書くのか、Js2coffeeでチェックしてみよう。 Js2coffeeはJavaScriptファイルを読み込んでCofeeScriptに変換するソフトウェアだ。公式サイトではWeb上でJavaScriptからの変換を試すことができる