- الوصف :
BillSum ، تلخيص للكونغرس الأمريكي ومشاريع قوانين ولاية كاليفورنيا.
هناك عدة ميزات: - النص: نص الفاتورة. - ملخص: ملخص مشاريع القوانين. - العنوان: عنوان مشروعات القوانين. ميزات فواتير لنا. لا تملك فواتير كاليفورنيا. - text_len: عدد الأحرف في النص. - sum_len: عدد الأحرف باختصار.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/FiscalNote/BillSum
كود المصدر :
tfds.datasets.billsum.Builder
إصدارات :
-
3.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
64.14 MiB
حجم مجموعة البيانات :
260.84 MiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'ca_test' | 1،237 |
'test' | 3269 |
'train' | 18،949 |
- هيكل الميزة :
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
ملخص | نص | سلسلة | ||
نص | نص | سلسلة | ||
لقب | نص | سلسلة |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('text', 'summary')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}