(201701/23追記) この記事にミスが見つかりましたので是非とも訂正編もあわせてご覧になってください。すみません。 人間だれでも一度は姓名分割を自動化したくなったことがありますよね? しかしながらネットにはほんの少ししか姓名分割にチャレンジしている人がいないのが現状です。 精度もあまり高くありません。 ということで自分で姓名分割プログラムを作ってみました。 まあまあうまくいったのでブログにする次第です。 試行錯誤はけっこうしたのですが、内容がぶれるのを恐れてあくまで手法の解説記事とします。 要件 入力:篠田麻里子 出力:篠田 麻里子 のようなプログラムを作る ざっくりした方針 さて、まず絶対にやりたくなかったのが苗字・名前データベースの作成です。理由は以下です。 ・どれだけ苗字を用意すればいいのかわからない ・森、森久、森久保など苗字がどこまでなのかの判定が難しそうだったから(データ