टीएफडीएस अब क्रोइसैन 🥐 प्रारूप का समर्थन करता है! अधिक जानने के लिए दस्तावेज़ पढ़ें.

इस पेज का अनुवाद Cloud Translation API से किया गया है.

gov_report

विवरण :

सरकारी रिपोर्ट डेटासेट में कांग्रेसनल रिसर्च सर्विस और यूएस गवर्नमेंट एकाउंटेबिलिटी ऑफिस सहित सरकारी अनुसंधान एजेंसियों द्वारा लिखी गई रिपोर्ट शामिल हैं।

अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://gov-report-data.github.io/
स्रोत कोड : tfds.summarization.gov_report.GovReport
संस्करण :
- 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
डाउनलोड आकार : 320.59 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (डिफ़ॉल्ट कॉन्फ़िगरेशन)

Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। व्हॉट्सएप द्वारा संरचनाएं चपटी और जुड़ी हुई हैं। यह मूल पेपर द्वारा उपयोग किया जाने वाला प्रारूप है
डेटासेट का आकार : 349.76 MiB
विभाजन :

विभाजित करना	उदाहरण
`'test'`	362
`'train'`	6,514
`'validation'`	362

फ़ीचर संरचना :

FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	डीटाइप
	विशेषताएं डिक्ट
पहचान	मूलपाठ	डोरी
जारी तिथि	मूलपाठ	डोरी
रिपोर्टों	मूलपाठ	डोरी
सारांश	मूलपाठ	डोरी
शीर्षक	मूलपाठ	डोरी

पर्यवेक्षित कुंजी ( as_supervised दस्तावेज़ देखें): ('reports', 'summary')
उदाहरण ( tfds.as_dataframe ):

gov_report/gao_whitespace

कॉन्फिग विवरण : गाओ रिपोर्ट हाईलाइट स्ट्रक्चर्स के साथ चपटा और व्हॉट्सएप द्वारा जोड़ा गया। यह मूल पेपर द्वारा उपयोग किया जाने वाला प्रारूप है
डेटासेट का आकार : 690.24 MiB
विभाजन :

विभाजित करना	उदाहरण
`'test'`	611
`'train'`	11,005
`'validation'`	612

फ़ीचर संरचना :

FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	डीटाइप
	विशेषताएं डिक्ट
factfact	मूलपाठ	डोरी
प्रमुखता से दिखाना	मूलपाठ	डोरी
पहचान	मूलपाठ	डोरी
प्रकाशित तिथि	मूलपाठ	डोरी
जारी तिथि	मूलपाठ	डोरी
रिपोर्ट good	मूलपाठ	डोरी
शीर्षक	मूलपाठ	डोरी
यूआरएल	मूलपाठ	डोरी

पर्यवेक्षित कुंजी ( as_supervised दस्तावेज़ देखें): ('report', 'highlight')
उदाहरण ( tfds.as_dataframe ):

gov_report/crs_html

Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। HTML टैग जोड़ते समय संरचनाएं चपटी और न्यूलाइन से जुड़ गईं। <h2>xxx<h2> जैसे प्रारूप में केवल seition_title के लिए टैग जोड़े जाते हैं।
डेटासेट का आकार : 351.25 MiB
विभाजन :

विभाजित करना	उदाहरण
`'test'`	362
`'train'`	6,514
`'validation'`	362

फ़ीचर संरचना :

FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	डीटाइप
	विशेषताएं डिक्ट
पहचान	मूलपाठ	डोरी
जारी तिथि	मूलपाठ	डोरी
रिपोर्टों	मूलपाठ	डोरी
सारांश	मूलपाठ	डोरी
शीर्षक	मूलपाठ	डोरी

पर्यवेक्षित कुंजी ( as_supervised दस्तावेज़ देखें): ('reports', 'summary')
उदाहरण ( tfds.as_dataframe ):

gov_report/gao_html

कॉन्फ़िग विवरण : html टैग जोड़ते समय हाईलाइट स्ट्रक्चर्स के साथ GAO रिपोर्ट चपटी और नई लाइन से जुड़ी हुई। <h2>xxx<h2> जैसे प्रारूप में केवल seition_title के लिए टैग जोड़े जाते हैं।
डेटासेट का आकार : 692.72 MiB
विभाजन :

विभाजित करना	उदाहरण
`'test'`	611
`'train'`	11,005
`'validation'`	612

फ़ीचर संरचना :

FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	डीटाइप
	विशेषताएं डिक्ट
factfact	मूलपाठ	डोरी
प्रमुखता से दिखाना	मूलपाठ	डोरी
पहचान	मूलपाठ	डोरी
प्रकाशित तिथि	मूलपाठ	डोरी
जारी तिथि	मूलपाठ	डोरी
रिपोर्ट good	मूलपाठ	डोरी
शीर्षक	मूलपाठ	डोरी
यूआरएल	मूलपाठ	डोरी

पर्यवेक्षित कुंजी ( as_supervised दस्तावेज़ देखें): ('report', 'highlight')
उदाहरण ( tfds.as_dataframe ):

gov_report/crs_json

Config विवरण : सारांश के साथ सीआरएस रिपोर्ट। कच्चे जोंस के रूप में प्रस्तुत संरचनाएं।
डेटासेट का आकार : 361.92 MiB
विभाजन :

विभाजित करना	उदाहरण
`'test'`	362
`'train'`	6,514
`'validation'`	362

फ़ीचर संरचना :

FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	डीटाइप
	विशेषताएं डिक्ट
पहचान	मूलपाठ	डोरी
जारी तिथि	मूलपाठ	डोरी
रिपोर्टों	मूलपाठ	डोरी
सारांश	मूलपाठ	डोरी
शीर्षक	मूलपाठ	डोरी

पर्यवेक्षित कुंजी ( as_supervised दस्तावेज़ देखें): ('reports', 'summary')
उदाहरण ( tfds.as_dataframe ):

gov_report/gao_json

कॉन्फिग विवरण : गाओ रिपोर्ट हाईलाइट स्ट्रक्चर्स के साथ रॉ जोंस के रूप में प्रदर्शित।
डेटासेट का आकार : 712.82 MiB
विभाजन :

विभाजित करना	उदाहरण
`'test'`	611
`'train'`	11,005
`'validation'`	612

फ़ीचर संरचना :

FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	डीटाइप
	विशेषताएं डिक्ट
factfact	मूलपाठ	डोरी
प्रमुखता से दिखाना	मूलपाठ	डोरी
पहचान	मूलपाठ	डोरी
प्रकाशित तिथि	मूलपाठ	डोरी
जारी तिथि	मूलपाठ	डोरी
रिपोर्ट good	मूलपाठ	डोरी
शीर्षक	मूलपाठ	डोरी
यूआरएल	मूलपाठ	डोरी

पर्यवेक्षित कुंजी ( as_supervised दस्तावेज़ देखें): ('report', 'highlight')
उदाहरण ( tfds.as_dataframe ):

gov_report संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.