はじめに 前回はの入門ということで、QuikStartの内容を触ってみました。 kento1109.hatenablog.com 前回は英語でしたが、日本語のテキストを扱う場合はそのまま使うことは出来ません。 ということで、今回はpytorch-transformersで日本語のテキストを扱ってみようと思います。 Pretrained model 日本語でのPretrained modelとしては、京大の黒橋・河原研究室が公開しているものが有名です。 BERT日本語Pretrainedモデル - KUROHASHI-KAWAHARA LAB このリソースを利用した既存のやってみたシリーズとしては以下などが参考となります。 Pytorchで日本語のbert学習済みモデルを動かすまで - Qiita pytorchでBERTの日本語学習済みモデルを利用する - 文章埋め込み編 - Out-of