gov_report

  • विवरण :

सरकारी रिपोर्ट डेटासेट में कांग्रेसनल रिसर्च सर्विस और यूएस गवर्नमेंट एकाउंटेबिलिटी ऑफिस सहित सरकारी अनुसंधान एजेंसियों द्वारा लिखी गई रिपोर्ट शामिल हैं।

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। व्हॉट्सएप द्वारा संरचनाएं चपटी और जुड़ी हुई हैं। यह मूल पेपर द्वारा उपयोग किया जाने वाला प्रारूप है

  • डेटासेट का आकार : 349.76 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 362
'train' 6,514
'validation' 362
  • फ़ीचर संरचना :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
पहचान मूलपाठ डोरी
जारी तिथि मूलपाठ डोरी
रिपोर्टों मूलपाठ डोरी
सारांश मूलपाठ डोरी
शीर्षक मूलपाठ डोरी

gov_report/gao_whitespace

  • कॉन्फिग विवरण : गाओ रिपोर्ट हाईलाइट स्ट्रक्चर्स के साथ चपटा और व्हॉट्सएप द्वारा जोड़ा गया। यह मूल पेपर द्वारा उपयोग किया जाने वाला प्रारूप है

  • डेटासेट का आकार : 690.24 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 611
'train' 11,005
'validation' 612
  • फ़ीचर संरचना :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
factfact मूलपाठ डोरी
प्रमुखता से दिखाना मूलपाठ डोरी
पहचान मूलपाठ डोरी
प्रकाशित तिथि मूलपाठ डोरी
जारी तिथि मूलपाठ डोरी
रिपोर्ट good मूलपाठ डोरी
शीर्षक मूलपाठ डोरी
यूआरएल मूलपाठ डोरी

gov_report/crs_html

  • Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। HTML टैग जोड़ते समय संरचनाएं चपटी और न्यूलाइन से जुड़ गईं। <h2>xxx<h2> जैसे प्रारूप में केवल seition_title के लिए टैग जोड़े जाते हैं।

  • डेटासेट का आकार : 351.25 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 362
'train' 6,514
'validation' 362
  • फ़ीचर संरचना :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
पहचान मूलपाठ डोरी
जारी तिथि मूलपाठ डोरी
रिपोर्टों मूलपाठ डोरी
सारांश मूलपाठ डोरी
शीर्षक मूलपाठ डोरी

gov_report/gao_html

  • कॉन्फ़िग विवरण : html टैग जोड़ते समय हाईलाइट स्ट्रक्चर्स के साथ GAO रिपोर्ट चपटी और नई लाइन से जुड़ी हुई। <h2>xxx<h2> जैसे प्रारूप में केवल seition_title के लिए टैग जोड़े जाते हैं।

  • डेटासेट का आकार : 692.72 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 611
'train' 11,005
'validation' 612
  • फ़ीचर संरचना :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
factfact मूलपाठ डोरी
प्रमुखता से दिखाना मूलपाठ डोरी
पहचान मूलपाठ डोरी
प्रकाशित तिथि मूलपाठ डोरी
जारी तिथि मूलपाठ डोरी
रिपोर्ट good मूलपाठ डोरी
शीर्षक मूलपाठ डोरी
यूआरएल मूलपाठ डोरी

gov_report/crs_json

  • Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। कच्चे जोंस के रूप में प्रस्तुत संरचनाएं।

  • डेटासेट का आकार : 361.92 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 362
'train' 6,514
'validation' 362
  • फ़ीचर संरचना :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
पहचान मूलपाठ डोरी
जारी तिथि मूलपाठ डोरी
रिपोर्टों मूलपाठ डोरी
सारांश मूलपाठ डोरी
शीर्षक मूलपाठ डोरी

gov_report/gao_json

  • कॉन्फिग विवरण : गाओ रिपोर्ट हाईलाइट स्ट्रक्चर्स के साथ रॉ जोंस के रूप में प्रदर्शित।

  • डेटासेट का आकार : 712.82 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 611
'train' 11,005
'validation' 612
  • फ़ीचर संरचना :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
factfact मूलपाठ डोरी
प्रमुखता से दिखाना मूलपाठ डोरी
पहचान मूलपाठ डोरी
प्रकाशित तिथि मूलपाठ डोरी
जारी तिथि मूलपाठ डोरी
रिपोर्ट good मूलपाठ डोरी
शीर्षक मूलपाठ डोरी
यूआरएल मूलपाठ डोरी