形態素解析と単語のベクトル化してみた - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/fumitoshi

4 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

形態素解析と単語のベクトル化してみた - Qiita

# データ型を文字列型に変換（pythonの書き方） text = binarydata.decode('shift_jis') # いらないデー... # データ型を文字列型に変換（pythonの書き方） text = binarydata.decode('shift_jis') # いらないデータを削ぎ落とす text = re.split(r'\-{5,}',text)[2] text = re.split(r'底本：',text)[0] text = text.strip() # 形態素解析を行う t = Tokenizer() results = [] lines = text.split("\r\n") # 行ごとに分けられている for line in lines: s = line s = s.replace('|','') s = re.sub(r'《.+?》','',s) s = re.sub(r'［＃.+?］','',s) tokens = t.tokenize(s) # 解析したやつが入っている r = [] # 一

ブックマークしたユーザー

okishima_k2022/05/21
Hiro_Matsuno2020/09/29
gengohouse2020/09/29

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx