
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
韻を扱いたいpart7(BOW) - Qiita
内容 これまでとはちょっと違ったことをしてみる。テキストの分割方法に頭を悩ましていたが、母音「aiue... 内容 これまでとはちょっと違ったことをしてみる。テキストの分割方法に頭を悩ましていたが、母音「aiueo」の一致を見るのであれば、母音を様々に並べ、その母音が文章中に出てきたかどうかを示すことで、文章同士を比べられるのでは?という考えのもとやってみる。つまり、「出現頻度を気にせず、各単語が出現したかどうかのみに着目する」バイナリ表現という方法の各単語を母音の様々な並びにする。 様々な母音の並びを単語に見立てたword_listの作成 from pykakasi import kakasi import re import numpy as np import pandas as pd with open("./gennama.txt","r", encoding="utf-8") as f: data = f.read() vowel_list = ["a","i","u","e","o"