機械翻訳の翻訳性能を示す指標として、BLEU(bilingual evaluation understudy)スコアをはじめ、いくつかの指標が提案されています。その多くは、機械翻訳で翻訳された訳文が、人間が翻訳した「正しい」訳文とどれだけ似ているか(あるいはどれだけ異なっているか)を表しています。 機械の訳文が人間の訳文に似ていればいるほど、機械翻訳の性能がよいと考えられます。そこで、文の類似度を自動的に計算できれば、翻訳の品質を自動的に評価することが可能になります。 人間が訳した参照訳を用意できない場合でも、原文を機械翻訳にかけたのち、訳文を機械翻訳で原語に戻し、元の原文との類似度を計算することが考えられます。原文と逆翻訳文が似ていればいるほど、訳文の品質がよい可能性が高いでしょう。 では、2つの文の類似度を計算するには、どうすればよいでしょうか。いくつかの計算方法がありますが、この記事
![文の類似度を計算する方法](https://cdn-ak-scissors.b.st-hatena.com/image/square/554ea3d8bc77965da8a09dc537cc28b269d7673e/height=288;version=1;width=512/https%3A%2F%2Fferret-one.akamaized.net%2Fimages%2F5f182840dbea2022f34656fa%2Flarge.png%3Futime%3D1595418688)