- Descriptif :
BoolQ est un ensemble de données de questions-réponses pour les questions oui/non contenant 15942 exemples. Ces questions se posent naturellement, elles sont générées dans des contextes spontanés et sans contraintes.
Chaque exemple est un triplet de (question, passage, réponse), avec le titre de la page comme contexte supplémentaire facultatif. La configuration de la classification des paires de textes est similaire aux tâches d'inférence en langage naturel existantes.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/google-research-datasets/boolean-questions
Code source :
tfds.datasets.bool_q.Builder
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
8.36 MiB
Taille du jeu de données :
8.51 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 9 427 |
'validation' | 3 270 |
- Structure des fonctionnalités :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
réponse | Tenseur | bourdonner | ||
passage | Texte | chaîne de caractères | ||
question | Texte | chaîne de caractères | ||
Titre | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}