বহু_সংবাদ

  • বর্ণনা :

মাল্টি-নিউজ, নিউজার ডটকম সাইট থেকে সংবাদ নিবন্ধ এবং এই নিবন্ধগুলির মানব-লিখিত সারাংশ নিয়ে গঠিত। প্রতিটি সারাংশ পেশাদারভাবে সম্পাদকদের দ্বারা লেখা হয় এবং উদ্ধৃত মূল নিবন্ধগুলির লিঙ্কগুলি অন্তর্ভুক্ত করে।

দুটি বৈশিষ্ট্য রয়েছে: - নথি: বিশেষ টোকেন "|||||" দ্বারা পৃথক করা সংবাদ নিবন্ধের পাঠ্য। - সারাংশ: সংবাদ সারাংশ।

বিভক্ত উদাহরণ
'test' 5,622
'train' 44,972
'validation' 5,622
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
নথি পাঠ্য স্ট্রিং
সারসংক্ষেপ পাঠ্য স্ট্রিং
  • উদ্ধৃতি :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}