先日,日英中基本文データ - KUROHASHI-KAWAHARA LABが公開されていました.対訳コーパスは機械翻訳のタスクで使われるコーパスで,例えば日本語と英語など,複数の言語で文単位で対応がついているテキストデータです.最近の統計的機械翻訳の流行からか,色々な対訳コーパスが無料で使えるようになってきているようです.Wikipedia日英京都関連文書対訳コーパス日英中基本文データ - KUROHASHI-KAWAHARA LABJapanese-English Parallel Corpus - 日英パラレルコーパス日英対訳文対応付けデータ大規模オープンソース日英対訳コーパスの構築The EMILLE CorpusEuroparl Parallel Corpus Extracting Multilingual Parallel Sentences from tatoeba.com (