سموم

  • توضیحات :

SAMSum Corpus حاوی بیش از 16 هزار گفتگوی چت با خلاصه های دستی است.

دو ویژگی وجود دارد:

شکاف مثال ها
'test' 819
'train' 14732
'validation' 818
  • ساختار ویژگی :
FeaturesDict({
    'dialogue': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
گفتگو متن رشته
شناسه متن رشته
خلاصه متن رشته
  • نقل قول :
@article{gliwa2019samsum,
  title={SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization},
  author={Gliwa, Bogdan and Mochol, Iwona and Biesek, Maciej and Wawer, Aleksander},
  journal={arXiv preprint arXiv:1911.12237},
  year={2019}
}