- বর্ণনা :
বিলসাম, মার্কিন কংগ্রেসনাল এবং ক্যালিফোর্নিয়া রাজ্য বিলের সারসংক্ষেপ।
বেশ কয়েকটি বৈশিষ্ট্য রয়েছে: - পাঠ্য: বিল পাঠ্য। - সারাংশ: বিলের সারাংশ। - শিরোনাম: বিলের শিরোনাম। আমাদের বিলের জন্য বৈশিষ্ট্য। ca বিল নেই। - text_len: টেক্সটে অক্ষরের সংখ্যা। - sum_len: সারাংশে অক্ষরের সংখ্যা।
সোর্স কোড :
tfds.datasets.billsum.Builder
সংস্করণ :
-
3.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
64.14 MiB
ডেটাসেটের আকার :
260.84 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'ca_test' | 1,237 |
'test' | 3,269 |
'train' | 18,949 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
সারসংক্ষেপ | পাঠ্য | স্ট্রিং | ||
পাঠ্য | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং |
তত্ত্বাবধানে থাকা কী (
as_supervised
doc ):('text', 'summary')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}