こんにちは! 株式会社MatrixFlowのMatrixFlowチームです。 今回はMatrixFlow バージョン0.3.8で自然言語処理のアルゴリズムを大きく増やしたので、使ってみたいと思います。 まず、今回増やしたアルゴリズムですが、BERTとWord2VecとBM25+を使えるようにしました。 それぞれの解説を軽くしたいと思います。 BERTとはTransformerという手法を使ったDeep Learningのモデルです。 2018の10月にGoogleの研究チームが発表し、2020年7月の現在では5000近くの論文で引用されています。文章読解のベンチマーク「SQuAD 1.1」で人間の精度を初めて超えたことで話題になりました。また特定のタスクだけでなく多種類のタスクで最高精度を出したのも業界を驚かせました。 MatrixFlowは内部では「HuggingFace」のモジュールを