lỗ hổng

  • Mô tả :

GAP là một bộ dữ liệu cân bằng giới tính chứa 8.908 cặp (đại từ mơ hồ, tên tiền đề) được gắn nhãn tham chiếu, được lấy mẫu từ Wikipedia và được Google AI Language phát hành để đánh giá độ phân giải của tham chiếu trong các ứng dụng thực tế.

Tách ra ví dụ
'test' 2.000
'train' 2.000
'validation' 454
  • Cấu trúc tính năng :
FeaturesDict({
    'A': Text(shape=(), dtype=string),
    'A-coref': bool,
    'A-offset': int32,
    'B': Text(shape=(), dtype=string),
    'B-coref': bool,
    'B-offset': int32,
    'ID': Text(shape=(), dtype=string),
    'Pronoun': Text(shape=(), dtype=string),
    'Pronoun-offset': int32,
    'Text': Text(shape=(), dtype=string),
    'URL': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
Một Chữ chuỗi
A-coref tenxơ bool
A-offset tenxơ int32
b Chữ chuỗi
lõi B tenxơ bool
B-offset tenxơ int32
TÔI Chữ chuỗi
đại từ Chữ chuỗi
đại từ bù đắp tenxơ int32
Chữ Chữ chuỗi
URL Chữ chuỗi
  • trích dẫn :
@article{DBLP:journals/corr/abs-1810-05201,
  author    = {Kellie Webster and
               Marta Recasens and
               Vera Axelrod and
               Jason Baldridge},
  title     = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
  journal   = {CoRR},
  volume    = {abs/1810.05201},
  year      = {2018},
  url       = {http://arxiv.org/abs/1810.05201},
  archivePrefix = {arXiv},
  eprint    = {1810.05201},
  timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}