- Descriptif :
QuALITY, un ensemble de données de compréhension à choix multiples et à lecture longue.
Nous fournissons uniquement la version brute.
Page d' accueil : https://github.com/nyu-mll/quality
Code source :
tfds.datasets.quality.Builder
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
17.26 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Structure des fonctionnalités :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Documentation des fonctionnalités :
Caractéristique | Classe | Façonner | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
article | Texte | chaîne de caractères | ||
article_id | Texte | chaîne de caractères | ||
difficultés | Séquence (tenseur) | (Aucun,) | bourdonner | |
gold_labels | Séquence (tenseur) | (Aucun,) | int32 | |
choix | Séquence(Séquence(Texte)) | (Aucun, Aucun) | chaîne de caractères | |
question_ids | Séquence (texte) | (Aucun,) | chaîne de caractères | |
des questions | Séquence (texte) | (Aucun,) | chaîne de caractères | |
set_unique_id | Texte | chaîne de caractères | ||
la source | Texte | chaîne de caractères | ||
Titre | Texte | chaîne de caractères | ||
sujet | Texte | chaîne de caractères | ||
URL | Texte | chaîne de caractères | ||
id_écrivain | Texte | chaîne de caractères | ||
écrivain_étiquettes | Séquence (tenseur) | (Aucun,) | int32 |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
qualité/brut (configuration par défaut)
Description de la configuration : Raw avec HTML.
Taille du jeu de données :
22.18 MiB
Exemples ( tfds.as_dataframe ):
qualité/dépouillé
Description de la configuration : dépouillé de HTML.
Taille du jeu de données :
20.73 MiB
Exemples ( tfds.as_dataframe ):