- Descripción :
El conjunto de datos de opinión de Opinosis consta de oraciones extraídas de reseñas de 51 temas. Los temas y las opiniones se obtienen de Tripadvisor, Edmunds.com y Amazon.com.
Documentación adicional : Explore en Papers With Code
Página de inicio: http://kavita-ganesan.com/opinosis/
Código fuente :
tfds.datasets.opinosis.Builder
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de la descarga :
739.65 KiB
Tamaño del conjunto de datos :
725.45 KiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 51 |
- Estructura de características :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
revisión_enviados | Texto | cuerda | ||
resúmenes | Secuencia (Texto) | (Ninguna,) | cuerda |
Claves supervisadas (Ver
as_supervised
):('review_sents', 'summaries')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}