この投稿は 「自然言語処理 Advent Calendar 2019 - Qiita」 の25日目の記事です。 sinyです。 この記事では、2019年時点の自然言語処理において大きな役割を果たしているBERTを使ったネガポジ分類機の作成についてまとめました。 はじめに 書籍、ブログやQiitaなどでBERTに関するナレッジはだいぶ出回って来たと思います。 しかし、自然言語処理に活用できるデータセットの多くが英語をベースとしており、日本語のデータセットがあまりない状況のため、なかなか日本語のテキストを使ってBERTを活用するという事例、情報が少ないと感じました。 現状、無料で使える日本語データセットとしては以下がメジャーかと思います。 青空文庫 Twitter日本語評判分析データセット SNOW D18 日本語感情表現辞書 livedoor ニュースコーパス 「ある程度のデータ数があり、日
![BERTを用いたネガポジ分類機の作成 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/1e458474bc99f95b51ef414777c50dbc0c7c465f/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Fadvent-calendar-ogp-background-7940cd1c8db80a7ec40711d90f43539e.jpg%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9QkVSVCVFMyU4MiU5MiVFNyU5NCVBOCVFMyU4MSU4NCVFMyU4MSU5RiVFMyU4MyU4RCVFMyU4MiVBQyVFMyU4MyU5RCVFMyU4MiVCOCVFNSU4OCU4NiVFOSVBMSU5RSVFNiVBOSU5RiVFMyU4MSVBRSVFNCVCRCU5QyVFNiU4OCU5MCZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZ0eHQtY29sb3I9JTIzM0EzQzNDJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnM9MjA4MDdmNTRmNTI5MTQxMTNkNTI1NTAwNTY1ZmZmNjE%26mark-x%3D120%26mark-y%3D96%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9OTcyJnR4dD0lNDB5c2lueSZ0eHQtY29sb3I9JTIzM0EzQzNDJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9NGNmMDQ3ODQ4MWE1MzI3MTNkZTAxMzc3ODgyOTI5MjY%26blend-x%3D120%26blend-y%3D500%26blend-mode%3Dnormal%26s%3D31da9f1c1c58518d254310d1f83f06ed)