山下たつをさんの転置インデックスによる検索システムを作ってみよう!のコードをPythonで真似してみました。Python2.5じゃないと動きません。 ファイルフォーマットや使い方はそのままですが、フォーマット検査をちゃんとやってないです。正規表現のキャプチャ、Pythonでも簡単に書けないかなぁ。 index.py #!/usr/bin/env python import sys, codecs from collections import defaultdict sys.stdout = codecs.getwriter("utf-8")(sys.stdout) index = defaultdict(lambda:list()) num_docs = 0 for line in sys.stdin: doc = line.decode("utf-8").strip().split("

