- Açıklama :
Multi-News,newser.com sitesinden alınan haberler ve bu makalelerin insan eliyle yazılmış özetlerinden oluşmaktadır. Her özet, editörler tarafından profesyonelce yazılır ve alıntılanan orijinal makalelere bağlantılar içerir.
İki özelliği vardır: - belge: "|||||" özel belirteci ile ayrılmış haber makalelerinin metni. - özet: haber özeti.
Ana Sayfa : https://github.com/Alex-Fabbri/Multi-News
Kaynak kodu :
tfds.summarization.MultiNews
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
245.06 MiB
Veri kümesi boyutu :
669.80 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 5.622 |
'train' | 44.972 |
'validation' | 5.622 |
- Özellik yapısı :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
belge | Metin | sicim | ||
özet | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):('document', 'summary')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}