- Descriptif :
Composé de 30 étudiants d'une des classes de premier cycle de l'auteur. Ces paires de phrases couvrent des sujets allant d'événements réels (par exemple, le plan de l'Iran d'attaquer l'ambassadeur saoudien aux États-Unis) à des événements/personnages de films (par exemple, Batman) et des situations purement imaginaires, reflétant largement la culture pop telle qu'elle est perçue par les enfants américains. né au début des années 90. Chaque exemple annoté s'étend sur quatre lignes : la première ligne contient la phrase, la deuxième ligne contient le pronom cible, la troisième ligne contient les deux antécédents candidats et la quatrième ligne contient l'antécédent correct. Si le pronom cible apparaît plus d'une fois dans la phrase, sa première occurrence est celle à résoudre.
Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : https://www.hlt.utdallas.edu/~vince/data/emnlp12/
Code source :
tfds.text.DefinitePronounResolution
Versions :
-
1.1.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
222.12 KiB
Taille du jeu de données :
334.22 KiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 564 |
'train' | 1 322 |
- Structure des fonctionnalités :
FeaturesDict({
'candidates': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'pronoun': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
candidats | Séquence (texte) | (2,) | chaîne | |
étiqueter | Étiquette de classe | int64 | ||
pronom | Texte | chaîne | ||
phrase | Texte | chaîne |
Touches supervisées (Voir
as_supervised
doc ):('sentence', 'label')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{rahman2012resolving,
title={Resolving complex cases of definite pronouns: the winograd schema challenge},
author={Rahman, Altaf and Ng, Vincent},
booktitle={Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning},
pages={777--789},
year={2012},
organization={Association for Computational Linguistics}
}