タグ

2013年5月14日のブックマーク (1件)

  • TokuLog 改めB日記

    pure kotlin な double array の実装である KDary をリリースした https://central.sonatype.com/artifact/io.github.tokuhirom.kdary/kdary https://github.com/tokuhirom/kdary KMP(Kotlin Multiplatform) 環境で Mac アプリを実装していた。その中で雑な文書要約をしたくなり、 TF-IDF を使いたくなった。日語で TF-IDF を使うには単語を分かち書きする必要があるわけだが、分かち書きするには形態素解析機を使うのが手っ取り早いということになる。しかしながら、KMP 環境では利用できる日形態素解析機は存在していない。 ないものは作るしかないので、作るのだが、日語の形態素解析を効率よくやるためには共通接頭辞検索を行う必要がある。こ