- Descrizione :
I dati contengono insiemi da 1 a 7 triple della forma soggetto-predicato-oggetto estratti da (DBpedia)[ https://wiki.dbpedia.org/ ] e testo in linguaggio naturale che è una verbalizzazione di queste triple. I dati del test coprono 15 domini diversi di cui solo 10 compaiono nei dati di addestramento. Il set di dati segue un formato di tabella standardizzato.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://webnlg-challenge.loria.fr/challenge_2017/
Codice sorgente :
tfds.structured.web_nlg.WebNlg
Versioni :
-
0.1.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
19.76 MiB
Dimensione del set di dati:
13.78 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'test_all' | 4.928 |
'test_unseen' | 2.433 |
'train' | 18,102 |
'validation' | 2.268 |
- Struttura delle caratteristiche :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
testo di input | CaratteristicheDict | |||
testo_input/contesto | Tensore | corda | ||
testo_input/tabella | Sequenza | |||
input_text/table/column_header | Tensore | corda | ||
testo_input/tabella/contenuto | Tensore | corda | ||
testo_input/tabella/numero_riga | Tensore | int16 | ||
testo_destinazione | Tensore | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('input_text', 'target_text')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}