- Descrizione :
Il set di dati dei rapporti governativi è costituito da rapporti scritti da agenzie di ricerca governative, tra cui il Congressional Research Service e l'US Government Accountability Office.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://gov-report-data.github.io/
Codice sorgente :
tfds.summarization.gov_report.GovReport
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensione del download :
320.59 MiB
Cache automatica ( documentazione ): No
Figura ( tfds.show_examples ): non supportato.
Citazione :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (configurazione predefinita)
Descrizione della configurazione : rapporto CRS con riepilogo. Strutture appiattite e unite da spazi bianchi. Questo è il formato utilizzato dalla carta originale
Dimensione del set di dati:
349.76 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struttura delle caratteristiche :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
id | Testo | corda | ||
data_rilascio | Testo | corda | ||
rapporti | Testo | corda | ||
riepilogo | Testo | corda | ||
titolo | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('reports', 'summary')
Esempi ( tfds.as_dataframe ):
gov_report/gao_whitespace
Descrizione della configurazione : rapporto GAO con evidenziazione Strutture appiattite e unite da spazi bianchi. Questo è il formato utilizzato dalla carta originale
Dimensione del set di dati:
690.24 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struttura delle caratteristiche :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
fastfact | Testo | corda | ||
evidenziare | Testo | corda | ||
id | Testo | corda | ||
data_pubblicata | Testo | corda | ||
data_rilascio | Testo | corda | ||
rapporto | Testo | corda | ||
titolo | Testo | corda | ||
URL | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('report', 'highlight')
Esempi ( tfds.as_dataframe ):
gov_report/crs_html
Descrizione della configurazione : rapporto CRS con riepilogo. Strutture appiattite e unite da newline durante l'aggiunta di tag html. I tag vengono aggiunti solo per secition_title in un formato come
<h2>xxx<h2>
.Dimensione del set di dati:
351.25 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struttura delle caratteristiche :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
id | Testo | corda | ||
data_rilascio | Testo | corda | ||
rapporti | Testo | corda | ||
riepilogo | Testo | corda | ||
titolo | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('reports', 'summary')
Esempi ( tfds.as_dataframe ):
gov_report/gao_html
Descrizione della configurazione : rapporto GAO con evidenziazione Strutture appiattite e unite da una nuova riga durante l'aggiunta di tag html. I tag vengono aggiunti solo per secition_title in un formato come
<h2>xxx<h2>
.Dimensione del set di dati:
692.72 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struttura delle caratteristiche :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
fastfact | Testo | corda | ||
evidenziare | Testo | corda | ||
id | Testo | corda | ||
data_pubblicata | Testo | corda | ||
data_rilascio | Testo | corda | ||
rapporto | Testo | corda | ||
titolo | Testo | corda | ||
URL | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('report', 'highlight')
Esempi ( tfds.as_dataframe ):
gov_report/crs_json
Descrizione della configurazione : rapporto CRS con riepilogo. Strutture rappresentate come raw json.
Dimensione del set di dati:
361.92 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struttura delle caratteristiche :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
id | Testo | corda | ||
data_rilascio | Testo | corda | ||
rapporti | Testo | corda | ||
riepilogo | Testo | corda | ||
titolo | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('reports', 'summary')
Esempi ( tfds.as_dataframe ):
gov_report/gao_json
Descrizione della configurazione : rapporto GAO con evidenziazione Strutture rappresentate come raw json.
Dimensione del set di dati:
712.82 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struttura delle caratteristiche :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
fastfact | Testo | corda | ||
evidenziare | Testo | corda | ||
id | Testo | corda | ||
data_pubblicata | Testo | corda | ||
data_rilascio | Testo | corda | ||
rapporto | Testo | corda | ||
titolo | Testo | corda | ||
URL | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('report', 'highlight')
Esempi ( tfds.as_dataframe ):