- বর্ণনা :
সরকারী রিপোর্ট ডেটাসেট কংগ্রেশনাল রিসার্চ সার্ভিস এবং ইউএস গভর্নমেন্ট একাউন্টিবিলিটি অফিস সহ সরকারী গবেষণা সংস্থাগুলি দ্বারা লিখিত রিপোর্ট নিয়ে গঠিত।
হোমপেজ : https://gov-report-data.github.io/
উত্স কোড :
tfds.summarization.gov_report.GovReport
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড আকার :
320.59 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (ডিফল্ট কনফিগারেশন)
কনফিগ বিবরণ : সারাংশ সহ CRS রিপোর্ট। কাঠামো সমতল এবং সাদা স্থান দ্বারা যোগদান. এটি আসল কাগজ দ্বারা ব্যবহৃত বিন্যাস
ডেটাসেটের আকার :
349.76 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
আইডি | পাঠ্য | স্ট্রিং | ||
মুক্তির_তারিখ | পাঠ্য | স্ট্রিং | ||
রিপোর্ট | পাঠ্য | স্ট্রিং | ||
সারসংক্ষেপ | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('reports', 'summary')
উদাহরণ ( tfds.as_dataframe ):
gov_report/gao_whitespace
কনফিগারের বিবরণ : হাইলাইট স্ট্রাকচার সমতল এবং হোয়াইটস্পেস দ্বারা যুক্ত GAO রিপোর্ট। এটি আসল কাগজ দ্বারা ব্যবহৃত বিন্যাস
ডেটাসেটের আকার :
690.24 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
দ্রুত ঘটনা | পাঠ্য | স্ট্রিং | ||
লক্ষণীয় করা | পাঠ্য | স্ট্রিং | ||
আইডি | পাঠ্য | স্ট্রিং | ||
প্রকাশিত_তারিখ | পাঠ্য | স্ট্রিং | ||
মুক্তির_তারিখ | পাঠ্য | স্ট্রিং | ||
রিপোর্ট | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং | ||
url | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('report', 'highlight')
উদাহরণ ( tfds.as_dataframe ):
gov_report/crs_html
কনফিগ বিবরণ : সারাংশ সহ CRS রিপোর্ট। এইচটিএমএল ট্যাগ যোগ করার সময় কাঠামো সমতল এবং নিউলাইন দ্বারা যুক্ত হয়। ট্যাগগুলি শুধুমাত্র
<h2>xxx<h2>
এর মত একটি বিন্যাসে বিভাগ_শিরোনামের জন্য যোগ করা হয়।ডেটাসেটের আকার :
351.25 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
আইডি | পাঠ্য | স্ট্রিং | ||
মুক্তির_তারিখ | পাঠ্য | স্ট্রিং | ||
রিপোর্ট | পাঠ্য | স্ট্রিং | ||
সারসংক্ষেপ | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('reports', 'summary')
উদাহরণ ( tfds.as_dataframe ):
gov_report/gao_html
কনফিগারেশনের বিবরণ : এইচটিএমএল ট্যাগ যোগ করার সময় হাইলাইট স্ট্রাকচার সমতল এবং নিউলাইন দ্বারা যুক্ত GAO রিপোর্ট। ট্যাগগুলি শুধুমাত্র
<h2>xxx<h2>
এর মত একটি বিন্যাসে বিভাগ_শিরোনামের জন্য যোগ করা হয়।ডেটাসেটের আকার :
692.72 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
দ্রুত ঘটনা | পাঠ্য | স্ট্রিং | ||
লক্ষণীয় করা | পাঠ্য | স্ট্রিং | ||
আইডি | পাঠ্য | স্ট্রিং | ||
প্রকাশিত_তারিখ | পাঠ্য | স্ট্রিং | ||
মুক্তির_তারিখ | পাঠ্য | স্ট্রিং | ||
রিপোর্ট | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং | ||
url | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('report', 'highlight')
উদাহরণ ( tfds.as_dataframe ):
gov_report/crs_json
কনফিগ বিবরণ : সারাংশ সহ CRS রিপোর্ট। কাঠামো কাঁচা json হিসাবে উপস্থাপিত.
ডেটাসেটের আকার :
361.92 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
আইডি | পাঠ্য | স্ট্রিং | ||
মুক্তির_তারিখ | পাঠ্য | স্ট্রিং | ||
রিপোর্ট | পাঠ্য | স্ট্রিং | ||
সারসংক্ষেপ | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('reports', 'summary')
উদাহরণ ( tfds.as_dataframe ):
gov_report/gao_json
কনফিগারেশনের বিবরণ : হাইলাইট স্ট্রাকচার সহ GAO রিপোর্ট কাঁচা json হিসাবে উপস্থাপিত।
ডেটাসেটের আকার :
712.82 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
দ্রুত ঘটনা | পাঠ্য | স্ট্রিং | ||
লক্ষণীয় করা | পাঠ্য | স্ট্রিং | ||
আইডি | পাঠ্য | স্ট্রিং | ||
প্রকাশিত_তারিখ | পাঠ্য | স্ট্রিং | ||
মুক্তির_তারিখ | পাঠ্য | স্ট্রিং | ||
রিপোর্ট | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং | ||
url | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('report', 'highlight')
উদাহরণ ( tfds.as_dataframe ):