タグ

2020年10月24日のブックマーク (1件)

  • Facebook、英語を中間言語としない機械翻訳システムをGitHubで公開

    米Facebookは10月19日(現地時間)、中間言語として英語を使わずにダイレクトに2国語間の翻訳を行う多言語機械翻訳(MMT)モデル、「M2M-100」を発表した。GitHubで公開している。 Facebookは現在、プラットフォーム上で提供している翻訳サービスでは中間言語として英語を介している。 新モデルでは英語データに依存せずに100言語の組み合わせで直接翻訳できるとしている。これにより、機械翻訳の評価に一般的に使わるBLEUの評価が、英語を介するシステムより平均で10ポイント高くなったという。 中間言語として英語を用いるのは、サンプルデータが豊富だからだ。Facebookは数年かけて100言語の75億文のデータセットを構築し、150億以上のパラメータを使ってユニバーサル翻訳モデルをトレーニングした。 関連記事 Google翻訳にウイグル語など5カ国語追加で108言語対応に Goo

    Facebook、英語を中間言語としない機械翻訳システムをGitHubで公開