- Descrizione :
Multi-News, consiste in articoli di notizie e riassunti scritti dall'uomo di questi articoli dal sito newser.com. Ogni sommario è scritto professionalmente da editori e include collegamenti agli articoli originali citati.
Ci sono due caratteristiche: - documento: testo degli articoli di notizie separati da un token speciale "|||||". - sommario: sommario delle notizie.
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : https://github.com/Alex-Fabbri/Multi-News
Codice sorgente :
tfds.summarization.MultiNews
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
245.06 MiB
Dimensione del set di dati:
669.80 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'test' | 5.622 |
'train' | 44.972 |
'validation' | 5.622 |
- Struttura delle caratteristiche :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
documento | Testo | corda | ||
riepilogo | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('document', 'summary')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}