- Deskripsi :
GAP adalah kumpulan data seimbang gender yang berisi 8.908 pasangan berlabel koreferensi (kata ganti ambigu, nama anteseden), diambil sampelnya dari Wikipedia dan dirilis oleh Google AI Language untuk evaluasi resolusi koreferensi dalam aplikasi praktis.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/google-research-datasets/gap-coreference
Kode sumber :
tfds.text.Gap
Versi :
-
0.1.0
: Rilis awal. -
0.1.1
(default): Memperbaiki penguraian bidang booleanA-coref
danB-coref
.
-
Ukuran unduhan :
2.29 MiB
Ukuran dataset :
2.96 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 2.000 |
'train' | 2.000 |
'validation' | 454 |
- Struktur fitur :
FeaturesDict({
'A': Text(shape=(), dtype=string),
'A-coref': bool,
'A-offset': int32,
'B': Text(shape=(), dtype=string),
'B-coref': bool,
'B-offset': int32,
'ID': Text(shape=(), dtype=string),
'Pronoun': Text(shape=(), dtype=string),
'Pronoun-offset': int32,
'Text': Text(shape=(), dtype=string),
'URL': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
SEBUAH | Teks | rangkaian | ||
A-coref | Tensor | bool | ||
A-offset | Tensor | int32 | ||
B | Teks | rangkaian | ||
B-coref | Tensor | bool | ||
B-offset | Tensor | int32 | ||
PENGENAL | Teks | rangkaian | ||
Kata ganti | Teks | rangkaian | ||
Kata ganti-offset | Tensor | int32 | ||
Teks | Teks | rangkaian | ||
URL | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@article{DBLP:journals/corr/abs-1810-05201,
author = {Kellie Webster and
Marta Recasens and
Vera Axelrod and
Jason Baldridge},
title = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
journal = {CoRR},
volume = {abs/1810.05201},
year = {2018},
url = {http://arxiv.org/abs/1810.05201},
archivePrefix = {arXiv},
eprint = {1810.05201},
timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
bibsource = {dblp computer science bibliography, https://dblp.org}
}