[B! dataset][company] ishideoのブックマーク

ishideo id:ishideo

datasetとcompanyに関するishideoのブックマーク (3)

Google Dataset Search
‫العربية‬‪Deutsch‬‪English‬‪Español (España)‬‪Español (Latinoamérica)‬‪Français‬‪Italiano‬‪日本語‬‪한국어‬‪Nederlands‬Polski‬‪Português‬‪Русский‬‪ไทย‬‪Türkçe‬‪简体中文‬‪中文（香港）‬‪繁體中文‬
ishideo 2023/03/18
dataset

search

google

information-gathering

osint

company
リンク
産業における研究開発・イノベーションに関するデータ - 科学技術・学術政策研究所 (NISTEP)
特許データや各種の統計データを用いて、日本の産業における研究開発やイノベーションについての分析を行うための企業名辞書を公開しています。お知らせ 2023年9月13日 NISTEP企業名辞書Ver.2023_1の公開を行いました←NEW！ 2023年8月18日　　NISTEP大学・公的機関名辞書と特許出願情報との対応テーブルVer.2023_1の公開を行いました。 2022年11月10日　 NISTEP企業名辞書Ver.2022_1の公開を行いました。 2021年10月4日　　NISTEP企業名辞書Ver.2021_1の公開を行いました。 2020年9月23日　　NISTEP企業名辞書Ver.2020_2の公開を行いました。 2020年2月25日　　各データへのDOI付与とライブラリへの移行を行いました。データ整備についての概要産業における研究開発・イノベーションに関するデー
ishideo 2021/04/28
nistep

japan

company

public

database

dataset
リンク
公開されている日本の企業名辞書の紹介 - MNTSQ Techブログ
特許・契約書・有価証券報告書・企業関連ニュースなど、実応用上の自然言語処理では、会社名を認識したいという場面に非常に多く出くわす。会社名らしい文字列をテキストから抽出することは、形態素解析器の辞書を用いたり固有表現抽出モデルを学習することである程度実現される一方で、抽出した会社名をレコード化して分析などに用いる際には、いわゆる名寄せの問題が発生する。自然言語処理における名寄せに似た問題は、エンティティリンキングや共参照解析といったアプローチで探求されており、実応用上は前者のアプローチが採られることが多い印象がある。*1 名寄せタスクをエンティティリンキング的に解くためには、帰着先の知識ベース・辞書が予め存在していることが必要だが、研究の文脈では知識ベースとしてWikipediaが採用されることが多い。 Wikipediaを用いる利点は多くあり、様々なエンティティ種に対してそこそこのカバ
ishideo 2021/04/28
japan

company

database

dictionary

dataset

public
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx