- Descriptif :
Le corpus SNLI (version 1.0) est une collection de 570 000 paires de phrases en anglais écrites par des humains, étiquetées manuellement pour une classification équilibrée avec les étiquettes implication, contradiction et neutre, prenant en charge la tâche d'inférence du langage naturel (NLI), également connue sous le nom de reconnaissance de l'implication textuelle. (RTE).
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://nlp.stanford.edu/projects/snli/
Code source :
tfds.datasets.snli.Builder
Versions :
-
1.1.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
90.17 MiB
Taille du jeu de données :
87.00 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 10 000 |
'train' | 550 152 |
'validation' | 10 000 |
- Structure des fonctionnalités :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
hypothèse | Texte | chaîne | ||
étiquette | Étiquette de classe | int64 | ||
prémisse | Texte | chaîne |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}