- Açıklama :
Opinosis Opinion Dataset, 51 konu için incelemelerden çıkarılan cümlelerden oluşur. Konular ve görüşler Tripadvisor, Edmunds.com ve Amazon.com'dan alınmıştır.
Ana sayfa : http://kavita-ganesan.com/opinosis/
Kaynak kodu :
tfds.datasets.opinosis.Builder
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
739.65 KiB
Veri kümesi boyutu :
725.45 KiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 51 |
- Özellik yapısı :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
inceleme_sents | Metin | sicim | ||
özetler | Sıra(Metin) | (Hiçbiri,) | sicim |
Denetimli anahtarlar (Bkz
as_supervised
doc ):('review_sents', 'summaries')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}