- الوصف :
تتكون Multi-News من مقالات إخبارية وملخصات كتبها الإنسان لهذه المقالات من موقع newser.com. تتم كتابة كل ملخص بشكل احترافي من قبل المحررين ويتضمن روابط للمقالات الأصلية المقتبس منها.
هناك ميزتان: - المستند: نص المقالات الإخبارية مفصولة برمز خاص "|||||". - الملخص: ملخص الخبر.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية https://github.com/Alex-Fabbri/Multi-News
كود المصدر :
tfds.summarization.MultiNews
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
245.06 MiB
حجم مجموعة البيانات :
669.80 MiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 5622 |
'train' | 44972 |
'validation' | 5622 |
- هيكل الميزة :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
وثيقة | نص | سلسلة | ||
ملخص | نص | سلسلة |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('document', 'summary')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}