- বর্ণনা :
মাল্টি-নিউজ, নিউজার ডটকম সাইট থেকে সংবাদ নিবন্ধ এবং এই নিবন্ধগুলির মানব-লিখিত সারাংশ নিয়ে গঠিত। প্রতিটি সারাংশ পেশাদারভাবে সম্পাদকদের দ্বারা লেখা হয় এবং উদ্ধৃত মূল নিবন্ধগুলির লিঙ্কগুলি অন্তর্ভুক্ত করে।
দুটি বৈশিষ্ট্য রয়েছে: - নথি: বিশেষ টোকেন "|||||" দ্বারা পৃথক করা সংবাদ নিবন্ধের পাঠ্য। - সারাংশ: সংবাদ সারাংশ।
সোর্স কোড :
tfds.summarization.MultiNews
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
245.06 MiB
ডেটাসেটের আকার :
669.80 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 5,622 |
'train' | 44,972 |
'validation' | 5,622 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
নথি | পাঠ্য | স্ট্রিং | ||
সারসংক্ষেপ | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('document', 'summary')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}