5.2 doctest -- 対話モードを使った使用例の内容をテストする doctest モジュールは、対話的 Python セッションのように 見えるテキストを探し出し、セッションの内容を実行して、そこに書かれている 通りに振舞うかを調べます。 doctest は以下のような用途に よく使われています: モジュールの docstring (ドキュメンテーション文字列) 中にある対話 モードでの使用例全てが書かれている通りに動作するかを検証することで、 docstring の内容が最新のものになるよう保ちます。 テストファイルやテストオブジェクト中の対話モードにおける使用例が 期待通りに動作するかを検証することで、回帰テストを実現します。 入出力例をふんだんに使ったパッケージのチュートリアルドキュメントを 書けます。入出力例と解説文のどちらに注目するかによって、ドキュメントは 「読めるテス
back [English] 基本的な原理 レイアウト分析ツール analyze.py 本文を抽出する extract.py パターンファイルの構造 おわりに 基本的な原理 Webstemmer では、以下のような仮定をもとにして Web ページを分析しています。 すべての記事には共通した (たかだか数種類の) レイアウトが使われている。 各ページにはメインとなる文章がひとつ含まれている。 (従って、この原理は日記や掲示板などのサイトには使えません) 記事の文章は毎日変わっても、そのレイアウトは変わらない。 バナー広告やナビゲーションの HTML タグは同一レイアウトのページで不変。 Webstemmer はこの仮定をもとに、 あるニュースサイトの同一レイアウトをもつページをまとめ、 それらのページ中で「変化していない部分」をさがします。 バナーやナビゲーション用のリンクなどはレイアウトが
日本語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから本文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ
made The rev="made" relationship has been used to identify the author or "maker" of an HTML document. Example: <link rev="made" href="mailto:nori@noasobi.net" /> see also : INTERNET DRAFT Hypertext links in HTML meta The meta relationship identifies a hypertext link to a node which contains meta-information related to the currentdocument. Example: <link rel="meta" href="rss.rdf" /> see also : INTE
2003-11-12 web 昨日の続き(何)です。仕様書よく見たら made も定義されていないリンクタイプですた。当然、定義されているものとばかり思っていました。 となると大手を振って rev="made" と書くにはどっかで、定義してあるものを引っ張ってくればいいのかなと思いちょっと探してみたんですが、見当たりません。となると自分ででっち上げればいいのでしょうか。仕様書によれば This specification does not define formats for profiles. とのことなので、書式とかは特に定められていないようです。といってもいきなりどうしたらいいのかわからないので、昨日出てきた A Meta data Profile For Using URIs As XHTML/HTML Link Types を参考にしようと思いつつも、検索したらいくつか見つかりま
ホンダ(HONDA)オートテラス オリジナルムービー「家族の合言葉」~コンピュータの32ビットのことです。 ホンダ(HONDA)オートテラス オリジナルムービー「家族の合言葉」 参考情報:ホンダオートテラス オリジナルムービー家族の合言葉sucarhondacertifiedusedcarPR2親が子どものことを一番よく知っているように、Hondaのクルマを一番よく知っている専門のスタッフがお届けする妥協のない中古車クルマのあるお店、ホンダオートテラス。ホンダオートテラス オリジナルムービー家族の合言葉 syoutubeatchvNsbPxxIT7I21920171019 親が子どものことを一番よく知っているように、Hondaのクルマを一番よく知っている専門のスタッフがお届けする妥協のない中古車クルマのあるお店、ホンダオートテラス。 ホンダオートテラスのよーし 著者 本田技研工業株式会社
シェルスクリプトとはコマンドやシェルの組み込みコマンドなどをファイルに記述し、実行できるようにしたものである。 またプログラムの制御構造なども使用でき、柔軟な処理が可能であり、/etc/rc.d/initd/ディレクトリ内の起動スクリプトなどはシェルスクリプトである。 シェルスクリプトを実行するには実行権限および読み込み権限が必要です。 またシェルスクリプトファイルの1行目にはシェルスクリプトを実行するシェルのパスを記述します。 スクリプトファイル内でも、シェル変数を定義することができる。またその変数を参照する場合は変数名の前に" $ "を 付けることで参照できる。変数名に使用できる文字は英数字および" _ "(アンダーバー)であり先頭は英字を使用しなくてはならない。
call/cc を使って簡単な Coroutine を作ります。call/cc 入門だと思ってもらえれば幸いです。 coroutine とは ここでは coroutine を「実行の途中でリターンでき、さらにそこ(実行の途中)から再開することが出来る何か」の意味で使用します。適当な疑似言語で書くと次の通り。関数の途中でのリターンを suspend(), 途中からの再開を resume() で表すことにします。 void f(co) { // co は coroutine object の意味 int i = 0; while (true) { printf("=> %d\n", ++i); co.suspend(); } } co = coroutine.create(f); co.start(); // f(co) を呼び出す => 1 co.resume(); // suspend()
『UNIX今日の技』の zsh の項目について纏めたものです。 zsh は(おそらく)最強のシェルです。 しかし、どんなシェルでもそうですが、自分で設定してやらないと使えたものではありません。 デフォルトの zsh は鍛えられた tcsh に圧倒的な敗北を喫するでしょう。 本記事では zsh の上手な設定のレシピを提案します。 適当に取捨選択して取り込んで、シェルを「鍛えて」下さい。 なお、本項では zsh に特徴的なことのみをまとめていく方針です。 tcsh など、シェル一般に共通的な事柄については、『UNIX今日の技/シェル』に書いてありますので、こちらも併せてご覧頂くと良いと思います。 zsh をログインシェルにする? のはやめておいた方が良いと思います。 特に、NIS でやってしまうのはかなりマズいです。 duo などでは zsh が入っていないので「ログインシェルがないのでログイ
いったい Ruby のどこがいいのか? どのくらいいいのか? つーか本当にいいのか? まずはそのへんから。 なぜ Ruby か ――― 最重要事項 言語の好き嫌いは人によってさまざまだ。最初に覚えた言語が一番い いっていう保守的…いや、わるかった、信念の強いひともいる。ある いは、スピードが速いのがいいっていうひともいるし、'write only' にできるのがいいっていうひともいる。さらには「新しいからいい」 という節操のない…じゃなくて、好奇心の強いひともいる。 が、しかし、しかしだ。Ruby がすごい理由はどれもあてはまらない。 Ruby が Ruby たる所以は「書くのが楽しい」ところなのである。 これはめちゃくちゃ重要なことだからもう一度書こう。 Ruby は書くのが楽しいプログラム言語なのだ! どういうところが楽しいか なにが楽しいってそりゃいろいろあるけれども、まずインタプリ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く