JUMAN++は最近黒橋・河原研究室から発表された、JUMANの後継となる形態素解析器です。 これまでの形態素解析器と比べて違うのは、RNN言語モデルを用いて意味的自然さを考慮する、ニューラルネットワークを利用した形態素解析器となっている点です。 速度や語彙等の課題はあるものの、解析能力自体はMeCab以上なので、導入方法と共に触ってみた所感を述べてみます。 導入方法 前提 OS X Yosemite 10.10.5 VirtualBox 5.1.6 Vagrant 1.8.6 インストール vagrant boxは bento/ubuntu-16.04を使用します。 推奨はCentOSですが、自分の環境ではCentOSではビルドに失敗しました。 また、OSはubuntu16.04でもboxによっては上手くインストールすることができないため、bentoのboxがおすすめです。 $ vagr
![新形態素解析器JUMAN++を触ってみたけど思ったより高精度でMeCabから乗り換えようかと思った話](https://cdn-ak-scissors.b.st-hatena.com/image/square/c8a28299fb3f67245ff1710f68cb8f3a1f46c0c5/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUU2JTk2JUIwJUU1JUJEJUEyJUU2JTg1JThCJUU3JUI0JUEwJUU4JUE3JUEzJUU2JTlFJTkwJUU1JTk5JUE4SlVNQU4lMkIlMkIlRTMlODIlOTIlRTglQTclQTYlRTMlODElQTMlRTMlODElQTYlRTMlODElQkYlRTMlODElOUYlRTMlODElOTElRTMlODElQTklRTYlODAlOUQlRTMlODElQTMlRTMlODElOUYlRTMlODIlODglRTMlODIlOEElRTklQUIlOTglRTclQjIlQkUlRTUlQkElQTYlRTMlODElQTdNZUNhYiVFMyU4MSU4QiVFMyU4MiU4OSVFNCVCOSU5NyVFMyU4MiU4QSVFNiU4RiU5QiVFMyU4MSU4OCVFMyU4MiU4OCVFMyU4MSU4NiVFMyU4MSU4QiVFMyU4MSVBOCVFNiU4MCU5RCVFMyU4MSVBMyVFMyU4MSU5RiVFOCVBOSVCMSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnR4dC1jbGlwPWVsbGlwc2lzJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9NDVkZThkZWVhNDlhYTdmZDFkNTA0NGJjMDQ2ZmE1ZmQ%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwcml2ZXJ3ZWxsJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0wNGJmZjZiODFlMTU2MjBjZTE4OTgwMjhjZWFiMjA2Ng%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D4f7959cecfc7ec3e49f3fa32ac6e6c49)