JUMAN++は最近黒橋・河原研究室から発表された、JUMANの後継となる形態素解析器です。 これまでの形態素解析器と比べて違うのは、RNN言語モデルを用いて意味的自然さを考慮する、ニューラルネットワークを利用した形態素解析器となっている点です。 速度や語彙等の課題はあるものの、解析能力自体はMeCab以上なので、導入方法と共に触ってみた所感を述べてみます。 導入方法 前提 OS X Yosemite 10.10.5 VirtualBox 5.1.6 Vagrant 1.8.6 インストール vagrant boxは bento/ubuntu-16.04を使用します。 推奨はCentOSですが、自分の環境ではCentOSではビルドに失敗しました。 また、OSはubuntu16.04でもboxによっては上手くインストールすることができないため、bentoのboxがおすすめです。 $ vagr
![新形態素解析器JUMAN++を触ってみたけど思ったより高精度でMeCabから乗り換えようかと思った話](https://cdn-ak-scissors.b.st-hatena.com/image/square/c6497261a50e399cc84cdd8b5116f4ac1324c064/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9JUU2JTk2JUIwJUU1JUJEJUEyJUU2JTg1JThCJUU3JUI0JUEwJUU4JUE3JUEzJUU2JTlFJTkwJUU1JTk5JUE4SlVNQU4lMkIlMkIlRTMlODIlOTIlRTglQTclQTYlRTMlODElQTMlRTMlODElQTYlRTMlODElQkYlRTMlODElOUYlRTMlODElOTElRTMlODElQTklRTYlODAlOUQlRTMlODElQTMlRTMlODElOUYlRTMlODIlODglRTMlODIlOEElRTklQUIlOTglRTclQjIlQkUlRTUlQkElQTYlRTMlODElQTdNZUNhYiVFMyU4MSU4QiVFMyU4MiU4OSVFNCVCOSU5NyVFMyU4MiU4QSVFNiU4RiU5QiVFMyU4MSU4OCVFMyU4MiU4OCVFMyU4MSU4NiVFMyU4MSU4QiVFMyU4MSVBOCVFNiU4MCU5RCVFMyU4MSVBMyVFMyU4MSU5RiVFOCVBOSVCMSZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnM9YzZlMTUzZWU4OGUzYTBmYjhlYjMwOGRiZGU3ZjNkODE%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDByaXZlcndlbGwmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTA4ZDg4ZmNlOWFmNjQ1NWU5MmU0YmI4NTVhMmIwYTQ2%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3D5fb3c5a51a7e95894404901a38d37a58)