サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
eneprog.blogspot.com
前回の続きです。前回はエネルギー基本計画からgensim Phrasesを使って、複数回出現する単語の組み合わせを複合語候補として取り出し、名詞とみなせるかどうか判定しリストを作りました。 今回は、このリストを新語としてjanomeのユーザー辞書に登録します。 下記の記事を参考にしました。 Janomeドキュメント:ユーザー定義辞書を使う http://mocobeta.github.io/janome/#id7 コード7区:ツイートからユーザ辞書(MeCab や Janome 用)をpython で作ってみる http://ailaby.com/tweet_dict/ ・インポートとデータの確認 from janome.tokenizer import Tokenizer import pandas as pd words_judge 複合語候補回数単語判定 0再生_可能_エネルギー17
このページを最初にブックマークしてみませんか?
『データ解析の試み』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く