
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【Python】レーベンシュタイン距離とジャロ・ウィンクラー距離の計算方法 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【Python】レーベンシュタイン距離とジャロ・ウィンクラー距離の計算方法 - Qiita
この記事でやること 最近表題の2つの"距離"に触れる機会があったのだが、知らなかったのでまとめる ライ... この記事でやること 最近表題の2つの"距離"に触れる機会があったのだが、知らなかったのでまとめる ライブラリを使った計算方法もまとめる まず最初に導入として編集距離について説明する。 編集距離とは 2つの文字列がどれくらい似ているかを調べたいとする。 このとき、編集距離を使うと便利。 編集距離とは、挿入(insertion)、削除(deletion)、置換(substitution) を何回行えば 同じ文字にすることができるか、で考えることができる。 「編集距離が大きい = 文字列を揃えるのにコストがかかる = 類似度が低い」と言える。 編集距離は上記の組み合わせによって複数パターンが考えられるが、その中でも最小ものを最短編集距離と呼ぶ。 例えば「おにぎり」と「おまいり」と比較するとする。 この場合、「に→ま」、「ぎ→い」 と2回置換すれば一致できる。 一方で置換の作業を 「に」を削除→「