前にQiitaに書いた「Twitter 誹謗中傷撃退マシン」の記事は出来が良かったのにLGTMが伸び悩んでたため、疑問に思っておりましたところ。いちいち誹謗中傷ワードを配列に入れるのを面倒くさがられたのではと思いDeep Learningの力を借りました。 本記事の目的は前回同様 SNSの誹謗中傷をテクノロジーの力で救うこと です では、行ってみましょう!!! 事前知識 前回の記事で事前知識を学習して進めてください Twitter 誹謗中傷撃退マシン 誹謗中傷識別AIを作ろう word2vec, RNN(LSTM)を使ってモデルを作ります。データは"umich-sentiment-train.txt"という評判分析によく使われるデータセットを使います。 word2vecモデル Kerasを使って作成します。word2vecとは一言で言うと人間の言葉をベクトル(数字)におくアルゴリズムです。
![Twitter 誹謗中傷撃退マシン(最強版) - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/2a4ed82debfcac5a87e713758bc02e342fdaa305/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9VHdpdHRlciUyMCVFOCVBQSVCOSVFOCVBQyU5NyVFNCVCOCVBRCVFNSU4MiVCNyVFNiU5MiU4MyVFOSU4MCU4MCVFMyU4MyU5RSVFMyU4MiVCNyVFMyU4MyVCMyUyOCVFNiU5QyU4MCVFNSVCQyVCNyVFNyU4OSU4OCUyOSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9M2FiYmE5NjEyMTVhYTJiMWU1ZTJjNmI4MDFiNDYwMjE%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBwaWdyZXR5YXN1c2hpJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz04ZjVjYTkwNGE4ZWZhZDcwMzQxNzAzNTlkMzE1NzMzZg%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3D365b58e58a34012d62e8297affac3ae3)