qiita.com[B!]新着記事・評価 - はてなブックマーク

『qiita.com』

韓国語の形態素解析パッケージSoynlp (pure Python) - Qiita
3 users
qiita.com/sentencebird

!wget https://raw.githubusercontent.com/lovit/soynlp/master/tutorials/2016-10-20.txt -O 2016-10-20.txt こんな感じのファイルコーパスの読み込み行、または2つのスペースで文が区切られているとして、DoublespaceLineCorpusで読み込むとコーパスのオブジェクトが生成される。なぜ2つのスペース区切りなのかは不明。 from soynlp import DoublespaceLineCorpus # iter_sent=Trueだと1行に複数文を許容する corpus = DoublespaceLineCorpus("2016-10-20.txt", iter_sent=True)
- テクノロジー
- 2023/06/21 02:09
- Python

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx