- Descriptif :
Eraser Multi RC est un jeu de données pour les requêtes sur des passages multilignes, accompagné de réponses et d'une justification. Chaque exemple de cet ensemble de données comporte les 5 parties suivantes
- Un passage multiligne 2. Une question sur le passage 3. Une réponse à la question
- Un classement indiquant si la réponse est bonne ou mauvaise 5. Une explication justifiant le classement
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://cogcomp.seas.upenn.edu/multirc/
Code source :
tfds.text.EraserMultiRc
Versions :
-
0.1.1
(par défaut) : aucune note de version.
-
Taille du téléchargement :
1.59 MiB
Taille du jeu de données :
62.59 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 4 848 |
'train' | 24 029 |
'validation' | 3 214 |
- Structure des fonctionnalités :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
preuves | Séquence (texte) | (Aucun,) | chaîne de caractères | |
étiquette | Étiquette de classe | int64 | ||
passage | Texte | chaîne de caractères | ||
requête_et_réponse | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}