タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

nlpに関するyogoのブックマーク (3)

  • テキストの構造化を支える技術 -概要編- - Ahogrammer

    最近、情報抽出、特にOpen Information Extraction(OpenIE)という分野について勉強しています。せっかく勉強しているので、学んだ内容について何回かに分けて紹介していこうと思います。第一回目の今回は、OpenIEという分野の概要について紹介し、OpenIEのきっかけとなったシステムであるTextRunnerとその仕組みについて説明します。 Open Information Extractionとは? OpenIEについて述べる前に、まずは伝統的な情報抽出について述べておきましょう。情報抽出は非構造化データであるテキストを構造化された表現に変換するタスクです*1。情報抽出で抽出される情報は関係のタプルの形(arg1, rel, arg2)で表現されます。このタプルは関係を示すフレーズ(rel)とその対象であるエンティティ(args)から成ります。一般的な処理の流れと

    テキストの構造化を支える技術 -概要編- - Ahogrammer
    yogo
    yogo 2018/10/12
  • GeoNLP - テキストを自動的に地図化する地名情報処理ソフトウェア

    デモ テキストジオタギング(GeoNLP)デモ 住所ジオコーディング(jagecoder)デモ 概要 GeoNLPプロジェクトは、オープンな地名情報処理のためのソフトウェア、データ、サービスを研究開発するプロジェクトです。サイトはGeoNLPソフトウェアを中心に情報を提供します。 GeoNLPソフトウェアは、2021年7月にリリースしたVersion 2.0で大幅な変更を行い、PythonモジュールのPyGeonLPおよびPyGeoNLP WebAPIに生まれ変わりました。2022年2月にはVersion 2.1をリリースし、機械学習などの手法を導入しやすくなるよう、内部構造を大きく変更しました。 なお最新情報は以下をご覧下さい。 GeoNLPニュース GeoNLPソフトウェア変更履歴 インストール GeoNLPドキュメントの中のPyGeoNLPインストール手順をご覧下さい。またGitH

    GeoNLP - テキストを自動的に地図化する地名情報処理ソフトウェア
    yogo
    yogo 2015/05/26
  • 場所参照表現タグ付きコーパス Ver 0.1 (2015/05/25)

    概要 コーパスは,Twitterからランダムにサンプリングしたテキストに現れる,「特定の場所を著者が想定している」と判断できる表現に対して,実際にどのエンティティを指しているかを人手で判断しエンティティ情報を付与したコーパスです.GeoNLPなどのジオパーズシステム,エンティティリンキングシステム等の開発や評価に利用することを想定して構築されました. コーパスには以下のような特徴があります. 施設名へのアノテーション付与 : いわゆる「地名」(市区町村名など)だけではなく,「施設名」(駅名等)に対してもエンティティを付与しています. 一般名詞からなる表現にも付与 : 「特定の場所を著者が想定している」表現というと,すぐに思い浮かぶのは都道府県名・駅名などの固有名詞ですが,上図における「バス停」のように,一般名詞であっても,特定の場所を指し示す表現が存在するため,それらへもアノテーション

    yogo
    yogo 2015/05/26
  • 1