- opis :
Zbiór danych opinii Opinosis składa się ze zdań wyodrębnionych z recenzji dotyczących 51 tematów. Tematy i opinie pochodzą ze stron Tripadvisor, Edmunds.com i Amazon.com.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona domowa : http://kavita-ganesan.com/opinosis/
Kod źródłowy :
tfds.datasets.opinosis.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
739.65 KiB
Rozmiar zbioru danych :
725.45 KiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 51 |
- Struktura funkcji :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
recenzje_wysłane | Tekst | strunowy | ||
streszczenia | Sekwencja (tekst) | (Nic,) | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('review_sents', 'summaries')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}