タグ

ブックマーク / www.unixuser.org/~euske (2)

  • Webstemmer のしくみ

    back [English] 基的な原理 レイアウト分析ツール analyze.py 文を抽出する extract.py パターンファイルの構造 おわりに 基的な原理 Webstemmer では、以下のような仮定をもとにして Web ページを分析しています。 すべての記事には共通した (たかだか数種類の) レイアウトが使われている。 各ページにはメインとなる文章がひとつ含まれている。 (従って、この原理は日記や掲示板などのサイトには使えません) 記事の文章は毎日変わっても、そのレイアウトは変わらない。 バナー広告やナビゲーションの HTML タグは同一レイアウトのページで不変。 Webstemmer はこの仮定をもとに、 あるニュースサイトの同一レイアウトをもつページをまとめ、 それらのページ中で「変化していない部分」をさがします。 バナーやナビゲーション用のリンクなどはレイアウトが

  • Vnc2swf - 画面録画ユーティリティ

    ご意見あるいはご質問: 日語の場合は、新山 宛に直接お送りください。 英語では vnc2swf-users@lists.sourceforge.net にお送りください (メーリングリストの アーカイブ と 購読方法)。 更新履歴はこちら。 サンプルムービー Gnomine (250KBytes, 音声あり) (original version) Emacs (300KBytes) Mac OS X (5MBytes) Windows 2000 (2.2MBytes, 音声あり) SLIME on Linux (1.3MBytes, 音声あり) Python によるゲームプログラミング実況中継 (11MBytes, 音声あり) その他... Python 版と C 版はどうちがう? Vnc2swf には 2種類の異なる実装 (Python版と C版) があります。 Python版 (py

  • 1