はじめに こんにちは。システム開発部の中村です。 機械学習についての理解を促進するため、 データから分類モデルを自動で構築する古典的な方法である、 ナイーブベイズ分類器を実装してみました。 最近はCloudVisionAPIなど専ら画像解析が流行っていますが、 自分のような初学者には敷居が高そうだったため、まずは自然言語処理です。 今回は、TwitterAPIを利用してbotアカウントから名言を収集し、 羽生さんと羽生くんを分類する羽生分類器を実装しました。 尚、APIクライアントはRuby、分類器はPythonで実装し、 形態素解析にはMeCabを利用しています。 また本来ならばどちらも羽生さんとお呼びしなければならない所、 便宜上フィギュアスケーターの羽生さんを羽生くんと表記させて頂く事をお許し下さい。 ツイートデータの収集 APIClientは、Twitter Ruby Gemを使っ