タグ

ブックマーク / agora.ex.nii.ac.jp (1)

  • GeoNLPプロジェクト - 地名情報基盤のためのオープンなソフトウェア・データ・サービス

    識別子の付与 地名語辞書に登録した地名語をLODに接続するためには、地名語に対してGeoLODシステム内でユニークなIDを付与しなければならない。GeoNLPの基方針は、辞書制作者が独自に制作した複数の地名語辞書を組み合わせて利用する、というものである。しかし、この方針を前提とすると、地名語辞書内でユニークなIDを与えても、システム全体でユニークなIDとなる保証はないという問題が生じる。 この問題の解決策としてよく用いられる方法は、フィールド内の文字列を連結した文字列をキーとし、それをハッシュ関数に与えて固定長のIDを生成するなど、フィールド内容を変換することでIDを生成する方法である。もしフィールド内の文字列にユニーク性があれば、この方法でもIDを生成できる。しかし、この方法はフィールド内容の修正に弱く、内容の微修正を越えて永続性のあるIDを生成する目的には適していない。 そこで2段階

    k-side
    k-side 2014/09/08
    “自然言語文のジオタギングのための地名情報処理システム”
  • 1