gov_report

  • বর্ণনা :

সরকারী রিপোর্ট ডেটাসেট কংগ্রেশনাল রিসার্চ সার্ভিস এবং ইউএস গভর্নমেন্ট একাউন্টিবিলিটি অফিস সহ সরকারী গবেষণা সংস্থাগুলি দ্বারা লিখিত রিপোর্ট নিয়ে গঠিত।

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (ডিফল্ট কনফিগারেশন)

  • কনফিগ বিবরণ : সারাংশ সহ CRS রিপোর্ট। কাঠামো সমতল এবং সাদা স্থান দ্বারা যোগদান. এটি আসল কাগজ দ্বারা ব্যবহৃত বিন্যাস

  • ডেটাসেটের আকার : 349.76 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 362
'train' 6,514
'validation' 362
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
আইডি পাঠ্য স্ট্রিং
মুক্তির_তারিখ পাঠ্য স্ট্রিং
রিপোর্ট পাঠ্য স্ট্রিং
সারসংক্ষেপ পাঠ্য স্ট্রিং
শিরোনাম পাঠ্য স্ট্রিং

gov_report/gao_whitespace

  • কনফিগারের বিবরণ : হাইলাইট স্ট্রাকচার সমতল এবং হোয়াইটস্পেস দ্বারা যুক্ত GAO রিপোর্ট। এটি আসল কাগজ দ্বারা ব্যবহৃত বিন্যাস

  • ডেটাসেটের আকার : 690.24 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 611
'train' 11,005
'validation' 612
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
দ্রুত ঘটনা পাঠ্য স্ট্রিং
লক্ষণীয় করা পাঠ্য স্ট্রিং
আইডি পাঠ্য স্ট্রিং
প্রকাশিত_তারিখ পাঠ্য স্ট্রিং
মুক্তির_তারিখ পাঠ্য স্ট্রিং
রিপোর্ট পাঠ্য স্ট্রিং
শিরোনাম পাঠ্য স্ট্রিং
url পাঠ্য স্ট্রিং

gov_report/crs_html

  • কনফিগ বিবরণ : সারাংশ সহ CRS রিপোর্ট। এইচটিএমএল ট্যাগ যোগ করার সময় কাঠামো সমতল এবং নিউলাইন দ্বারা যুক্ত হয়। ট্যাগগুলি শুধুমাত্র <h2>xxx<h2> এর মত একটি বিন্যাসে বিভাগ_শিরোনামের জন্য যোগ করা হয়।

  • ডেটাসেটের আকার : 351.25 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 362
'train' 6,514
'validation' 362
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
আইডি পাঠ্য স্ট্রিং
মুক্তির_তারিখ পাঠ্য স্ট্রিং
রিপোর্ট পাঠ্য স্ট্রিং
সারসংক্ষেপ পাঠ্য স্ট্রিং
শিরোনাম পাঠ্য স্ট্রিং

gov_report/gao_html

  • কনফিগারেশনের বিবরণ : এইচটিএমএল ট্যাগ যোগ করার সময় হাইলাইট স্ট্রাকচার সমতল এবং নিউলাইন দ্বারা যুক্ত GAO রিপোর্ট। ট্যাগগুলি শুধুমাত্র <h2>xxx<h2> এর মত একটি বিন্যাসে বিভাগ_শিরোনামের জন্য যোগ করা হয়।

  • ডেটাসেটের আকার : 692.72 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 611
'train' 11,005
'validation' 612
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
দ্রুত ঘটনা পাঠ্য স্ট্রিং
লক্ষণীয় করা পাঠ্য স্ট্রিং
আইডি পাঠ্য স্ট্রিং
প্রকাশিত_তারিখ পাঠ্য স্ট্রিং
মুক্তির_তারিখ পাঠ্য স্ট্রিং
রিপোর্ট পাঠ্য স্ট্রিং
শিরোনাম পাঠ্য স্ট্রিং
url পাঠ্য স্ট্রিং

gov_report/crs_json

  • কনফিগ বিবরণ : সারাংশ সহ CRS রিপোর্ট। কাঠামো কাঁচা json হিসাবে উপস্থাপিত.

  • ডেটাসেটের আকার : 361.92 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 362
'train' 6,514
'validation' 362
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
আইডি পাঠ্য স্ট্রিং
মুক্তির_তারিখ পাঠ্য স্ট্রিং
রিপোর্ট পাঠ্য স্ট্রিং
সারসংক্ষেপ পাঠ্য স্ট্রিং
শিরোনাম পাঠ্য স্ট্রিং

gov_report/gao_json

  • কনফিগারেশনের বিবরণ : হাইলাইট স্ট্রাকচার সহ GAO রিপোর্ট কাঁচা json হিসাবে উপস্থাপিত।

  • ডেটাসেটের আকার : 712.82 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 611
'train' 11,005
'validation' 612
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
দ্রুত ঘটনা পাঠ্য স্ট্রিং
লক্ষণীয় করা পাঠ্য স্ট্রিং
আইডি পাঠ্য স্ট্রিং
প্রকাশিত_তারিখ পাঠ্য স্ট্রিং
মুক্তির_তারিখ পাঠ্য স্ট্রিং
রিপোর্ট পাঠ্য স্ট্রিং
শিরোনাম পাঠ্য স্ট্রিং
url পাঠ্য স্ট্রিং