- คำอธิบาย :
Multi-News ประกอบด้วยบทความข่าวและบทสรุปที่เขียนโดยมนุษย์ของบทความเหล่านี้จากไซต์ newser.com บทสรุปแต่ละรายการเขียนขึ้นอย่างมืออาชีพโดยบรรณาธิการและมีลิงก์ไปยังบทความต้นฉบับที่อ้างถึง
มีคุณสมบัติสองประการ: - เอกสาร: ข้อความของบทความข่าวที่คั่นด้วยโทเค็นพิเศษ "|||||" - สรุป: สรุปข่าว
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
รหัสที่มา :
tfds.summarization.MultiNews
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
245.06 MiB
ขนาดชุดข้อมูล :
669.80 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 5,622 |
'train' | 44,972 |
'validation' | 5,622 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
เอกสาร | ข้อความ | สตริง | ||
สรุป | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('document', 'summary')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}