エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Janomeが半角記号を「名詞,サ変接続」と認識するのを変更する - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Janomeが半角記号を「名詞,サ変接続」と認識するのを変更する - Qiita
はじめに MeCabと同様、Janomeでも半角文字を形態素解析すると「名詞,サ変接続」と予測される(ややこし... はじめに MeCabと同様、Janomeでも半角文字を形態素解析すると「名詞,サ変接続」と予測される(ややこしい)仕様が存在します。 from janome.tokenizer import Tokenizer tokenizer = Tokenizer() for t in tokenizer.tokenize("/"): print(t.surface, t.part_of_speech) #=> / 名詞,サ変接続,*,* from janome.tokenizer import Tokenizer tokenizer = Tokenizer() tokenizer.sys_dic.unknowns #=> {'DEFAULT': [(5, 5, 4769, '記号,一般,*,*')], 'SPACE': [(9, 9, 8903, '記号,空白,*,*')], 'KANJI': [