- Descrição :
Multi-News, consiste em artigos de notícias e resumos escritos por humanos desses artigos do site newser.com. Cada resumo é escrito profissionalmente por editores e inclui links para os artigos originais citados.
Existem duas características: - document: texto de artigos de notícias separados por token especial "|||||". - resumo: resumo da notícia.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://github.com/Alex-Fabbri/Multi-News
Código -fonte:
tfds.summarization.MultiNews
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
245.06 MiB
Tamanho do conjunto de dados :
669.80 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 5.622 |
'train' | 44.972 |
'validation' | 5.622 |
- Estrutura de recursos :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
documento | Texto | corda | ||
resumo | Texto | corda |
Chaves supervisionadas (consulte
as_supervised
doc ):('document', 'summary')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}