github.com 作りました。 README の通りまだ RTF ファイルを解析してテキスト化する機能しか持ってません (extract-text-from-rtf.php スクリプトを見て下さい)。 特徴 まだ機能が無さすぎて特にないのですが、あえて言うなら日本語に限らず、任意のコードページでエンコードされた RTF ファイルの内容をちゃんと表示できるはずです (もちろん日本語含めて)。 つまり日本語環境の Windows (=現在のロケールが CP932) で作った RTF ファイルをちゃんと文字化けせず表示できたりします。 コードページは \ansicpg という制御ワード (control word) でコードページを指定するのですが、ちゃんとそれを読み取って変換してくれます。 …という機能を今付けました (CP932 固定だった)。 あとちゃんとパースしてノード作ったりしてる