タグ

ブックマーク / www.unixuser.org/~euske (17)

  • R5RS (Revised^5 Report on Algorithmic Language Scheme) 日本語訳

    back これは Suzuki Hisao さん (suzuki@otsl.oki.co.jp) による、 Scheme の仕様書 R5RS (Revised^5 Report on Algorithmic Language Scheme) の日語訳です。新山が訳したわけではありません。 1999年 3月に fj.comp.lang.lisp に投稿されたものを、新山が コンパイル、変換しました。 R5RS の日語訳としては、犬飼 大さんによる日語訳が多く出回っていますが、 新山は Suzuki さんによる版のほうが読みやすいと思います。 [Gzipped tar, 97k] r5rs-ja.tar.gz Suzuki さんによって最初に fj に投稿された TeX ソースのアーカイブ。 以下のファイルはすべてここから生成しました。 [PDF, 430k] r5rs-ja.pdf P

  • OpenSSH 日本語 man

    OpenSSH SSH クライアント (リモート ログイン プログラム) 書式 ssh [-1246AaCfgKkMNnqsTtVvXxY ] [-b bindするアドレス ] [-c 暗号方式 ] [-D  [bindするアドレス :] ポート ] [-e エスケープ文字 ] [-F 設定ファイル ] [-i identityファイル ] [-L  [bindするアドレス :] ポート :ホスト:ホスト側ポート] [-l ログイン名 ] [-m MAC指定 ] [-O 制御コマンド ] [-o オプション ] [-p ポート ] [-R  [bindするアドレス :] ポート :ホスト:ホスト側ポート] [-S 制御用パス名 ] [-w ローカルtun [:リモートtun ] ] [ユーザ @] ホスト名 [コマンド ] 説明 ssh (SSH クライアント) はリモートマシンにログイン

    mhrs
    mhrs 2009/03/02
    SSH(1)
  • 女子高生のカーネル領域における言語的等価性

    概要 この論文では UNIX と女子高生の数学的同値性を証明する。 高度に発達した離散的コミュニティでは、 そこで使用される言語=表象はおよそ一般的な話し言葉とは著しく異なったものに対応させられる。 論文ではまず UNIX コミュニティにおける言語と女子高生コミュニティにおける言語の相似性を提示する。 つぎにこのような言語体系をうみだす環境の認知心理学的類似性について考察し、 UNIX が女子高生と数学的に等価であることを示す。また両者の今後の展開についても予測をおこなう。 相対的に分裂する主体 高度に発達したネットワークをもつコミュニティでは、各所属メンバーは自分の所属を意識せずにシステムに従属する。このような領域においては、ラトゥールが指摘したような特権化された「計算の中心」は存在せず、すべての主体は相対的な次元で表されるベクトルでしかありえない [Latour, 1999]。にもか

    mhrs
    mhrs 2007/05/28
  • Webstemmer のしくみ

    back [English] 基的な原理 レイアウト分析ツール analyze.py 文を抽出する extract.py パターンファイルの構造 おわりに 基的な原理 Webstemmer では、以下のような仮定をもとにして Web ページを分析しています。 すべての記事には共通した (たかだか数種類の) レイアウトが使われている。 各ページにはメインとなる文章がひとつ含まれている。 (従って、この原理は日記や掲示板などのサイトには使えません) 記事の文章は毎日変わっても、そのレイアウトは変わらない。 バナー広告やナビゲーションの HTML タグは同一レイアウトのページで不変。 Webstemmer はこの仮定をもとに、 あるニュースサイトの同一レイアウトをもつページをまとめ、 それらのページ中で「変化していない部分」をさがします。 バナーやナビゲーション用のリンクなどはレイアウトが

    mhrs
    mhrs 2006/05/21
  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ

    mhrs
    mhrs 2006/05/21
    「ニュースサイトから記事本文と記事のタイトルをプレインテキスト形式で自動的に抽出するソフトウェア」
  • PyOne - Python によるワンライナー

    Last Modified: Wed Feb 26 01:42:10 EST 2003 (02/26, 15:42 JST) これなに? PyOne は Python で quick & dirty なワンライナーを書くための支援スクリプトです。 アイデアは Pyawk とだいたい似ているのですが、 PyOne はより簡単に、ちょろっと書けるようなインターフェイスを目指しています。 基的にやってることはマクロ展開をして eval してるだけです。 PyOne は、初心者にはお勧めできない。 ワンライナーは読みにくいし意図しないミスも入りやすくなるし、 間違ってもこんなものを再利用しようなどと考えてはいけません。 これは Perl に毒された人専用です。 ダウンロード pyone-0.1.py (5KBytes) 説明 与えられたスクリプトをインデントされた Python コードに 変換し

    mhrs
    mhrs 2006/05/03
    「Perl に毒された人専用」
  • JIS, EUC, SJIS の漢字コードについて

    back 3つの 漢字コード 現在、コンピュータ上で日語テキストを表現するのに用いられている 漢字コードはおもに 3種類ある (昔は区点コードというコード体系も あったが、今ではすたれてしまった)。その 3種類は次のようなものである。 なお、最初に「0x」がつく文字列は、それが 16進数 (Hexadecimal) 表記であることを表す。 JIS漢字コード ASCII コード 0x21 〜 0x7E の文字 2つを組み合わせて 1つの 漢字を表現する。制御文字 (文字コード 0x1F 以下の文字) と共有できる、7bit 転送でも表現できる などの利点があるものの、漢字と通常の ASCII コード文字 (single-byte のアルファベット) が 共存できない。このために「漢字 IN」と「漢字 OUT」という 2つの 制御シーケンス (制御文字列) が導入されている。 漢字 IN …

  • 新聞記事にあらわれるカッコの使用法

    語の新聞には、英語の新聞に比べて非常に多くの丸カッコ () が使われています。 かぎカッコ 「」 は英語におけるクォーテーションマーク “ ” と ほぼ同じように扱えるものの、丸カッコについてはじつにさまざまな構文があり、 意味的にもその扱いは多種多様です。しかしカッコの中にはときに情報抽出にとって 重要な情報 (年齢・日時など) が含まれているため、丸カッコを無視することはできません。 ここでは無作為に抽出した新聞記事の中から、かぎカッコと丸カッコについて それぞれその使用法を分類してみました。 英語と日語の新聞にみる丸カッコの使用率の比較: 英語 (Wall Street Journal., PennTreeBank に含まれているものを使用): 1476文/49722文 = 3% 日語 (毎日新聞、95年 1月分): 2955文/23055文 = 13% 注意: 以下の例は、

    mhrs
    mhrs 2005/12/16
  • 文書とか (OpenSSH, djb, Python, Lisp/Scheme ...)

    OpenSSH 関連 djb 関連 Python 関連 / Pygame 関連 Lisp/Scheme 関連 実用もの 資料 どうでもいいもの 著作権について: 翻訳物に関してはもとの著者に著作権があります (翻訳に際して生じた著作権は主張しません)。 新山自身が書いたものに関しては出典を残すかぎりどのように利用していただいてもかまいません。 OpenSSH 関連 お知らせ: OpenBSDプロジェクトは2014年3月から多国語の文書翻訳がなくなり、英語に一化されています。 OpenSSH 日語マニュアルページ OpenSSH 各種コマンドの man ページの翻訳です。 PuTTY と OpenSSH の設定 Windows 用の SSH クライアント PuTTY を OpenSSH と相互運用させる手続きを 音声つきで解説したものです。 Theo de Raadt インタビュー (2

  • Scheme プログラミング入門

    back (技術評論社 Software Design誌 2000年 7月号 に掲載された、「Scheme への招待 〜 GNU標準のスクリプト言語入門」の 記事を加筆修正したものです *1) はじめに みなさんは Lisp をご存じでしょうか。Lisp は 1950年代後半*2に John McCarthy によって 開発されたプログラミング言語で、 おもに記号処理などの分野で今も利用されています。 Scheme は Lisp から派生した言語のひとつで、 Guy Lewis Steele Jr. および Gerald Jay Sussman によって 1975年に開発されました。Scheme はよく 「Lisp の方言」などと呼ばれますが、Lisp よりも簡単な仕様 で、それでいて複雑なプログラミングが可能なように設計されています。 どのプログラミング言語にも長所と短所がありますが、S

    mhrs
    mhrs 2005/09/02
    Schemeプログラミング入門。
  • 再帰とジェネレータ

    back [English] 概要: ある種の問題は、再帰を使うと非常に効率的に記述できる。 しかし大量のデータを生成するような再帰的手続きは厳密に制御する必要があり、 そういったプログラミングは難しい。Python 2.2 以降から使用可能になった ジェネレータを使うと、簡潔なコードを維持しつつ、 こうした手続きをかんたんに制御することができる。 この文書で使われているソースコードは こちら。 プレインテキスト版は こちら。 はじめに 再帰は非常に強力なメカニズムです。 時にこれは混乱を招くこともありますが、ふつう再帰を使うと、問題を簡単に記述することができます。 ある手続きが扱うデータ量が指数的に増えるような場合、これはとくにあてはまります。 木構造の探索がいい例でしょう。木の各節点はひとつ以上の子を持っていますが、 下へ下へとたどっていくにつれて、節点の数は指数的に増えていきます。

    mhrs
    mhrs 2005/09/02
  • Python おもちゃばこ (敬称)

    新山が Python を使っていくうえで作りためた 簡単なコマンドやライブラリをまとめています (の、予定)。 Python 関連文書も興味があればご覧ください。 なお、ここで公開しているファイル/文書は特に断りがある場合を除きすべて public domain (一部 MIT/X ライセンス) とします。 新山祐介はこれらのプログラムについていかなる責任も負いません。 ユーティリティ clitrans.py C#標準ライブラリのリファレンスマニュアル (XML形式) から、簡単なテキスト形式のファイルを生成します。 sortbydate.py ファイルを古い順 (あるいは新しい順) にソートして表示します。 vnc2flv Another screen recorder. Pyntch Pythonコードアナライザ。型推論をおこない、起こる可能性のあるエラーを表示します。 tenjiwp

    mhrs
    mhrs 2005/09/02
    「簡単なコマンドやライブラリ」。「小技・定石」もある(「getopt の使い方パターン」とか)。2006-05-09追記: 「(仮称)」から「(敬称)」になってゐた。
  • Vnc2swf - 画面録画ユーティリティ

    ご意見あるいはご質問: 日語の場合は、新山 宛に直接お送りください。 英語では vnc2swf-users@lists.sourceforge.net にお送りください (メーリングリストの アーカイブ と 購読方法)。 更新履歴はこちら。 サンプルムービー Gnomine (250KBytes, 音声あり) (original version) Emacs (300KBytes) Mac OS X (5MBytes) Windows 2000 (2.2MBytes, 音声あり) SLIME on Linux (1.3MBytes, 音声あり) Python によるゲームプログラミング実況中継 (11MBytes, 音声あり) その他... Python 版と C 版はどうちがう? Vnc2swf には 2種類の異なる実装 (Python版と C版) があります。 Python版 (py

    mhrs
    mhrs 2005/09/02
    デスクトップを録畫してFlashに。
  • 形態素解析ツールの品詞体系

    ChaSen 品詞体系 (IPA品詞体系) ChaSen の品詞体系は任意の階層化を許している。 いわゆる形容動詞は名詞の形容動詞語幹として含まれ、 形容詞には含まれない。Juman の指示詞という カテゴリは「連体詞」に含まれている。 判定詞「だ」は助動詞とされている。 Type1 Type2 Type3 Type4 Examples Description

    mhrs
    mhrs 2005/08/29
    Jumanと茶筌の品詞體系。
  • Make と Makefile の説明

    まだ完成途中です back 注意: このページの内容には、おそらく多くの間違いがあります。 リンクされているので残しておきますが、利用には注意してください。(2008年3月、新山) ここではおもに make の使い方 と Makefile の書き方について 説明しています。じつは make の種類にはいろいろあり、ここでは GNU make (gmake というコマンド名のこともある) を 対象にしています (BSD の pmake でも基的な部分は同じですが、 マクロ定義などは違うところもあるので注意してください)。 わかりにくい箇所とか、まちがってる箇所がある場合はメールください。 Contents make はどんなときに使うか Makefile を作る make の実行 Makefile の文法リファレンス 多段 make について (未完成) Makefile の例 (未完成)

    mhrs
    mhrs 2005/07/11
  • https://www.unixuser.org/~euske/doc/python/python-lisp-j.html

    mhrs
    mhrs 2005/06/08
    Python入門 (ブックマーク時のオリジナルタイトルは、何故か「*人* 門」)
  • 形態素解析・構文解析入門

    back 注意: このページの内容には、おそらく多くの間違いがあります。 リンクされているので残しておきますが、利用には注意してください。(2008年3月、新山) 目次 背景知識 形態素解析とは 構文解析とは 練習問題 言語処理関係の論文によく出てくる重要語 1. 背景知識 まず「形態素」、「構文」などといった用語は、ほとんどが 現在の科学的な「言語学」という分野に帰するものであることを 最初に知っておく必要がある。体系だった言語学は、おもに チョムスキー言語学の創始とともに始まった。 チョムスキーは 1960年代に、世界じゅうの数多くの言語には、 実はそのすべてに共通する「普遍文法 (universal grammer)」がある、と言った。 またチョムスキーはそのような文法を数学的な人工言語で 厳密に表現する方法をも開発した。彼によれば、言語にはその理想化された かたち (言語が言い間違

    mhrs
    mhrs 2005/06/05
    [morphologicalanalysis]
  • 1