- Descrizione :
Tabelle di Wikipedia con almeno 3 righe e 2 colonne, 3 righe casuali per ogni tabella sono state selezionate per ulteriori annotazioni. Ogni riga è stata annotata da una persona diversa, quindi il set di dati è composto da coppie (tabella di una riga, descrizione testuale). Le annotazioni includono almeno 2 celle della riga, ma non è necessario includerle tutte. Il set di dati segue un formato di tabella standardizzato.
Pagina iniziale : https://github.com/msra-nlc/Table2Text
Codice sorgente :
tfds.structured.wiki_table_text.WikiTableText
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensione del download :
3.70 MiB
Dimensione del set di dati:
4.64 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.000 |
'train' | 10.000 |
'validation' | 1.318 |
- Struttura delle caratteristiche :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
testo di input | CaratteristicheDict | |||
testo_input/tabella | Sequenza | |||
input_text/table/column_header | Tensore | corda | ||
testo_input/tabella/contenuto | Tensore | corda | ||
testo_input/tabella/numero_riga | Tensore | int16 | ||
testo_destinazione | Tensore | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('input_text', 'target_text')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}