- Descriptif :
L'ensemble de données LAMBADA évalue les capacités des modèles informatiques pour la compréhension de texte au moyen d'une tâche de prédiction de mots. LAMBADA est une collection de passages narratifs partageant la caractéristique que les sujets humains sont capables de deviner leur dernier mot s'ils sont exposés à l'ensemble du passage, mais pas s'ils ne voient que la dernière phrase précédant le mot cible
Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
Code source :
tfds.datasets.lambada.Builder
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
319.03 MiB
Taille du jeu de données :
3.49 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 5 153 |
'train' | 4 869 |
- Structure des fonctionnalités :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
passage | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}