- Descrizione :
QUALITY, un set di dati di comprensione della lettura a scelta multipla e lunga.
Forniamo solo la versione grezza.
Homepage : https://github.com/nyu-mll/quality
Codice sorgente :
tfds.datasets.quality.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensione del download :
17.26 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Struttura delle caratteristiche :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
articolo | Testo | corda | ||
articolo_id | Testo | corda | ||
difficoltà | Sequenza (tensore) | (Nessuno,) | bool | |
etichette_oro | Sequenza (tensore) | (Nessuno,) | int32 | |
opzioni | Sequenza(Sequenza(Testo)) | (Nessuno, nessuno) | corda | |
question_ids | Sequenza(Testo) | (Nessuno,) | corda | |
domande | Sequenza(Testo) | (Nessuno,) | corda | |
set_unique_id | Testo | corda | ||
fonte | Testo | corda | ||
titolo | Testo | corda | ||
argomento | Testo | corda | ||
URL | Testo | corda | ||
scrittore_id | Testo | corda | ||
etichette_scrittore | Sequenza (tensore) | (Nessuno,) | int32 |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
qualità/raw (configurazione predefinita)
Descrizione della configurazione : Raw con HTML.
Dimensione del set di dati:
22.18 MiB
Esempi ( tfds.as_dataframe ):
qualità/spogliato
Descrizione della configurazione : priva di HTML.
Dimensione del set di dati:
20.73 MiB
Esempi ( tfds.as_dataframe ):