【Python】不動産データに対して編集距離から類似度を計算してみた - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/moma_1992

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【Python】不動産データに対して編集距離から類似度を計算してみた - Qiita

はじめにこんにちは！株式会社estie(エスティ)でデータエンジニアをやっているいっしーです。本日はpy... はじめにこんにちは！株式会社estie(エスティ)でデータエンジニアをやっているいっしーです。本日はpython-Levenshteinライブラリを使って不動産データの類似度を簡単に計算できないか検証を行いたいと思います。背景不動産データを扱う際に気をつけたい点としてデータの表記揺れに対してどう向き合うかが重要になってくると思います。estie(エスティ)のような不動産のデータプラットフォームを構築していると、どうしても異なるデータソースから取得するビルの名称に表記揺れがあったり、住所の記載方法もまちまちなのでデータを管理する際に表記の揺れをどのように吸収するかがデータの質をより良くしていくためのカギとなってきます。目的今回の実験は、表記揺れした実際の物件データに対して類似度(編集距離)を算出し定量的に類似の物件データかを判別できないか検証していきたいと思います。検証概要今

ブックマークしたユーザー

mickn2020/12/08

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx