[B! *algorithm][*data][cs.CL] sh19910711のブックマーク

sh19910711 id:sh19910711

algorithmとdataとcs.CLに関するsh19910711のブックマーク (1)

【論文要約】TABERT: Pretraining for Joint Understanding of Textual and Tabular Data - Qiita
概要本論文では、NL文と（半）構造化テーブルの表現を合同で学習する事前学習済みLMであるTABERTを紹介する。TABERTは2600万個の表とその英語文脈からなる大規模なコーパスで学習される。実験では、TABERTを特徴表現層として用いたニューラル意味解析器が、弱教師あり意味解析ベンチマークであるWIKITABLEQUESTIONSで最良の結果を達成し、テキストtoSQLデータセットのSPIDERでも競争力のある性能を発揮することが分かった。 ACL 2020 第一著者：Pengcheng Yin 団体：Carnelgie Mellon University, Facebook AI Research 提案法 Content Snapshot データベーステーブルは大きいので、すべてを使うにはTransf ormerには重い。そこで、セルの値から必要な行だけ抽出するようにする。手法として
sh19910711 2024/05/03
"TABERT: 文と（半）構造化テーブルの表現を合同で学習 / WDC WebTable Corpus: WikipediaとCommonCrawlから収集した大規模テーブルデータ / 評価: Spiderデータセットを用いてテキストからSQL文を予測するタスク" arXiv:2005.08314 2022

*algorithm

*data

NLP

--

cs.CL
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx