タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

*algorithmと言葉に関するsh19910711のブックマーク (1)

  • 英独文法誤り訂正と機械翻訳の同時学習をする(本当は中間言語を再現したかった)話 - Qiita

    はじめに 文法誤り訂正のシステムは,誤り文を入れると修正文が出てきます.これは,一般的に,ニューラル機械翻訳の手法を使うことにより,誤り文から修正文への翻訳として実現されます.この学習データとして,学習者コーパスの誤り文と修正文のペアがよく用いられます.ここで,誤り文は図の「おかしい文」の集合全体,修正文は「ただしい文」の集合全体の部分集合になっています.(ただしさ・おかしさをgrammaticalである・ないってそのまま言っていいのかよくわからないので,あえてこういう言い方をしています) この学習者コーパスの規模が小さいく,質の良い機械翻訳モデルを学習するには不十分だということがよく言われています.そのため,「ただしい文」に人工的な誤りを加えて,データ拡張を行う研究が活発に行われています.流行りというやつです. ただ,ここで言うところの人工的な誤りが必ずしも「おかしい文」である保証はあま

    英独文法誤り訂正と機械翻訳の同時学習をする(本当は中間言語を再現したかった)話 - Qiita
    sh19910711
    sh19910711 2022/06/03
    "中間言語: 言語学習者の発達途上の言語体系 / 言語転移: 学習者の母語の知識が言語習得に影響を及ぼすこと / 英語とドイツ語は同じ西ゲルマン語群 > 英語が母語でない学習者であっても,英語からの転移が多く起きる"
  • 1