- विवरण :
सरकारी रिपोर्ट डेटासेट में कांग्रेसनल रिसर्च सर्विस और यूएस गवर्नमेंट एकाउंटेबिलिटी ऑफिस सहित सरकारी अनुसंधान एजेंसियों द्वारा लिखी गई रिपोर्ट शामिल हैं।
होमपेज : https://gov-report-data.github.io/
स्रोत कोड :
tfds.summarization.gov_report.GovReport
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
320.59 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (डिफ़ॉल्ट कॉन्फ़िगरेशन)
Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। व्हॉट्सएप द्वारा संरचनाएं चपटी और जुड़ी हुई हैं। यह मूल पेपर द्वारा उपयोग किया जाने वाला प्रारूप है
डेटासेट का आकार :
349.76 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- फ़ीचर संरचना :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
पहचान | मूलपाठ | डोरी | ||
जारी तिथि | मूलपाठ | डोरी | ||
रिपोर्टों | मूलपाठ | डोरी | ||
सारांश | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('reports', 'summary')
उदाहरण ( tfds.as_dataframe ):
gov_report/gao_whitespace
कॉन्फिग विवरण : गाओ रिपोर्ट हाईलाइट स्ट्रक्चर्स के साथ चपटा और व्हॉट्सएप द्वारा जोड़ा गया। यह मूल पेपर द्वारा उपयोग किया जाने वाला प्रारूप है
डेटासेट का आकार :
690.24 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- फ़ीचर संरचना :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
factfact | मूलपाठ | डोरी | ||
प्रमुखता से दिखाना | मूलपाठ | डोरी | ||
पहचान | मूलपाठ | डोरी | ||
प्रकाशित तिथि | मूलपाठ | डोरी | ||
जारी तिथि | मूलपाठ | डोरी | ||
रिपोर्ट good | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी | ||
यूआरएल | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('report', 'highlight')
उदाहरण ( tfds.as_dataframe ):
gov_report/crs_html
Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। HTML टैग जोड़ते समय संरचनाएं चपटी और न्यूलाइन से जुड़ गईं।
<h2>xxx<h2>
जैसे प्रारूप में केवल seition_title के लिए टैग जोड़े जाते हैं।डेटासेट का आकार :
351.25 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- फ़ीचर संरचना :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
पहचान | मूलपाठ | डोरी | ||
जारी तिथि | मूलपाठ | डोरी | ||
रिपोर्टों | मूलपाठ | डोरी | ||
सारांश | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('reports', 'summary')
उदाहरण ( tfds.as_dataframe ):
gov_report/gao_html
कॉन्फ़िग विवरण : html टैग जोड़ते समय हाईलाइट स्ट्रक्चर्स के साथ GAO रिपोर्ट चपटी और नई लाइन से जुड़ी हुई।
<h2>xxx<h2>
जैसे प्रारूप में केवल seition_title के लिए टैग जोड़े जाते हैं।डेटासेट का आकार :
692.72 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- फ़ीचर संरचना :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
factfact | मूलपाठ | डोरी | ||
प्रमुखता से दिखाना | मूलपाठ | डोरी | ||
पहचान | मूलपाठ | डोरी | ||
प्रकाशित तिथि | मूलपाठ | डोरी | ||
जारी तिथि | मूलपाठ | डोरी | ||
रिपोर्ट good | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी | ||
यूआरएल | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('report', 'highlight')
उदाहरण ( tfds.as_dataframe ):
gov_report/crs_json
Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। कच्चे जोंस के रूप में प्रस्तुत संरचनाएं।
डेटासेट का आकार :
361.92 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 362 |
'train' | 6,514 |
'validation' | 362 |
- फ़ीचर संरचना :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
पहचान | मूलपाठ | डोरी | ||
जारी तिथि | मूलपाठ | डोरी | ||
रिपोर्टों | मूलपाठ | डोरी | ||
सारांश | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('reports', 'summary')
उदाहरण ( tfds.as_dataframe ):
gov_report/gao_json
कॉन्फिग विवरण : गाओ रिपोर्ट हाईलाइट स्ट्रक्चर्स के साथ रॉ जोंस के रूप में प्रदर्शित।
डेटासेट का आकार :
712.82 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 611 |
'train' | 11,005 |
'validation' | 612 |
- फ़ीचर संरचना :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
factfact | मूलपाठ | डोरी | ||
प्रमुखता से दिखाना | मूलपाठ | डोरी | ||
पहचान | मूलपाठ | डोरी | ||
प्रकाशित तिथि | मूलपाठ | डोरी | ||
जारी तिथि | मूलपाठ | डोरी | ||
रिपोर्ट good | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी | ||
यूआरएल | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('report', 'highlight')
उदाहरण ( tfds.as_dataframe ):