はじめに こんにちは。システム開発部の中村です。 機械学習についての理解を促進するため、 データから分類モデルを自動で構築する古典的な方法である、 ナイーブベイズ分類器を実装してみました。 最近はCloudVisionAPIなど専ら画像解析が流行っていますが、 自分のような初学者には敷居が高そうだったため、まずは自然言語処理です。 今回は、TwitterAPIを利用してbotアカウントから名言を収集し、 羽生さんと羽生くんを分類する羽生分類器を実装しました。 尚、APIクライアントはRuby、分類器はPythonで実装し、 形態素解析にはMeCabを利用しています。 また本来ならばどちらも羽生さんとお呼びしなければならない所、 便宜上フィギュアスケーターの羽生さんを羽生くんと表記させて頂く事をお許し下さい。 ツイートデータの収集 APIClientは、Twitter Ruby Gemを使っ
![ナイーブベイズで羽生さんと羽生くんを分類してみた | DACエンジニアブログ:アドテクゑびす界](https://cdn-ak-scissors.b.st-hatena.com/image/square/4ed9dfc0936aae73d79e9e198ed8ea5aab874504/height=288;version=1;width=512/http%3A%2F%2Fimg.ak.impact-ad.jp%2Fic%2Fpone%2Fivt%2Fyebisupress%2Fimg%2Fth_ogp_image.png)