- Descriptif :
Les tableaux Wikipedia avec au moins 3 lignes et 2 colonnes, 3 lignes aléatoires pour chaque tableau ont été sélectionnés pour une annotation supplémentaire. Chaque ligne a été annotée par une personne différente, de sorte que l'ensemble de données est composé de paires (tableau à une ligne, description textuelle). Les annotations incluent au moins 2 cellules de la ligne, mais n'ont pas besoin de toutes les inclure. L'ensemble de données suit un format de tableau standardisé.
Page d' accueil : https://github.com/msra-nlc/Table2Text
Code source :
tfds.structured.wiki_table_text.WikiTableText
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
3.70 MiB
Taille du jeu de données :
4.64 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 2 000 |
'train' | 10 000 |
'validation' | 1 318 |
- Structure des fonctionnalités :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
Texte de saisie | FonctionnalitésDict | |||
input_text/table | Séquence | |||
input_text/table/column_header | Tenseur | chaîne de caractères | ||
input_text/table/contenu | Tenseur | chaîne de caractères | ||
input_text/table/row_number | Tenseur | int16 | ||
texte_cible | Tenseur | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):('input_text', 'target_text')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}