タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

自然言語処理に関するsato_susumuのブックマーク (1)

  • 類似文字列検索ライブラリResemblaを公開しました

    LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINEでClovaの開発をしている上村です。これはLINE Advent Calendar 2017の13日目の記事です。今日は文字列の話をします。 はじめに 与えられた文字列によく似たものを大きな文字列集合から探すということは、古典的でありふれていながら奥が深く難しい問題です。文字列の類似度を正確に見積もるには複雑な計算が必要ですが、膨大な量のコーパスが与えられたときも可能な限り高速に応答を返す必要があります。 検索する文字列の性質をよく把握することも、品質のよい類似文字列検索を行うためには極めて大切です。ここで、今回考える問題の例を見てみます。 この例では、1文字ずつ違いを見つけ出したり、単語単位で見たり、文全体が疑問文

    類似文字列検索ライブラリResemblaを公開しました
    sato_susumu
    sato_susumu 2021/11/03
    "短い文字列の類似性を求めることが簡単とは限らず、むしろ単語単位の処理を前提とする洗練された手法の多くが適用できなくなる場合もあります。"
  • 1