- Descriptif :
Race est un ensemble de données de compréhension de lecture à grande échelle avec plus de 28 000 passages et près de 100 000 questions. L'ensemble de données est collecté à partir d'examens d'anglais en Chine, qui sont conçus pour les collégiens et lycéens. L'ensemble de données peut servir d'ensembles d'entraînement et de test pour la compréhension de la machine.
Documentation complémentaire : Explorer sur Papers With Code
Description de la configuration : configuration du générateur pour le jeu de données RACE.
Page d' accueil : https://www.cs.cmu.edu/~glai1/data/race/
Code source :
tfds.datasets.race.Builder
Versions :
-
1.0.0
: Version initiale. -
2.0.0
(par défaut) : Ajoutez l'exemple d'identifiant.
-
Taille du téléchargement :
24.26 MiB
Mise en cache automatique ( documentation ): Oui
Structure des fonctionnalités :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Documentation des fonctionnalités :
Caractéristique | Classe | Façonner | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
réponses | Séquence (texte) | (Aucun,) | chaîne de caractères | |
article | Texte | chaîne de caractères | ||
example_id | Texte | chaîne de caractères | ||
choix | Séquence(Séquence(Texte)) | (Aucun, Aucun) | chaîne de caractères | |
des questions | Séquence (texte) | (Aucun,) | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
race/high (configuration par défaut)
Taille du jeu de données :
52.39 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'dev' | 1 021 |
'test' | 1 045 |
'train' | 18 728 |
- Exemples ( tfds.as_dataframe ):
race/milieu
Taille du jeu de données :
12.51 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6 409 |
- Exemples ( tfds.as_dataframe ):