- Mô tả :
GAP là một bộ dữ liệu cân bằng giới tính chứa 8.908 cặp (đại từ mơ hồ, tên tiền đề) được gắn nhãn tham chiếu, được lấy mẫu từ Wikipedia và được Google AI Language phát hành để đánh giá độ phân giải của tham chiếu trong các ứng dụng thực tế.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://github.com/google-research-datasets/gap-coreference
Mã nguồn :
tfds.text.Gap
Phiên bản :
-
0.1.0
: Bản phát hành đầu tiên. -
0.1.1
(mặc định): Sửa lỗi phân tích cú pháp của trường booleanA-coref
vàB-coref
.
-
Kích thước tải xuống :
2.29 MiB
Kích thước tập dữ liệu :
2.96 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 2.000 |
'train' | 2.000 |
'validation' | 454 |
- Cấu trúc tính năng :
FeaturesDict({
'A': Text(shape=(), dtype=string),
'A-coref': bool,
'A-offset': int32,
'B': Text(shape=(), dtype=string),
'B-coref': bool,
'B-offset': int32,
'ID': Text(shape=(), dtype=string),
'Pronoun': Text(shape=(), dtype=string),
'Pronoun-offset': int32,
'Text': Text(shape=(), dtype=string),
'URL': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
Một | Chữ | chuỗi | ||
A-coref | tenxơ | bool | ||
A-offset | tenxơ | int32 | ||
b | Chữ | chuỗi | ||
lõi B | tenxơ | bool | ||
B-offset | tenxơ | int32 | ||
TÔI | Chữ | chuỗi | ||
đại từ | Chữ | chuỗi | ||
đại từ bù đắp | tenxơ | int32 | ||
Chữ | Chữ | chuỗi | ||
URL | Chữ | chuỗi |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@article{DBLP:journals/corr/abs-1810-05201,
author = {Kellie Webster and
Marta Recasens and
Vera Axelrod and
Jason Baldridge},
title = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
journal = {CoRR},
volume = {abs/1810.05201},
year = {2018},
url = {http://arxiv.org/abs/1810.05201},
archivePrefix = {arXiv},
eprint = {1810.05201},
timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
bibsource = {dblp computer science bibliography, https://dblp.org}
}