gov_report

  • Descrizione :

Il set di dati dei rapporti governativi è costituito da rapporti scritti da agenzie di ricerca governative, tra cui il Congressional Research Service e l'US Government Accountability Office.

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (configurazione predefinita)

  • Descrizione della configurazione : rapporto CRS con riepilogo. Strutture appiattite e unite da spazi bianchi. Questo è il formato utilizzato dalla carta originale

  • Dimensione del set di dati: 349.76 MiB

  • Divisioni :

Diviso Esempi
'test' 362
'train' 6.514
'validation' 362
  • Struttura delle caratteristiche :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
id Testo corda
data_rilascio Testo corda
rapporti Testo corda
riepilogo Testo corda
titolo Testo corda

gov_report/gao_whitespace

  • Descrizione della configurazione : rapporto GAO con evidenziazione Strutture appiattite e unite da spazi bianchi. Questo è il formato utilizzato dalla carta originale

  • Dimensione del set di dati: 690.24 MiB

  • Divisioni :

Diviso Esempi
'test' 611
'train' 11.005
'validation' 612
  • Struttura delle caratteristiche :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
fastfact Testo corda
evidenziare Testo corda
id Testo corda
data_pubblicata Testo corda
data_rilascio Testo corda
rapporto Testo corda
titolo Testo corda
URL Testo corda

gov_report/crs_html

  • Descrizione della configurazione : rapporto CRS con riepilogo. Strutture appiattite e unite da newline durante l'aggiunta di tag html. I tag vengono aggiunti solo per secition_title in un formato come <h2>xxx<h2> .

  • Dimensione del set di dati: 351.25 MiB

  • Divisioni :

Diviso Esempi
'test' 362
'train' 6.514
'validation' 362
  • Struttura delle caratteristiche :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
id Testo corda
data_rilascio Testo corda
rapporti Testo corda
riepilogo Testo corda
titolo Testo corda

gov_report/gao_html

  • Descrizione della configurazione : rapporto GAO con evidenziazione Strutture appiattite e unite da una nuova riga durante l'aggiunta di tag html. I tag vengono aggiunti solo per secition_title in un formato come <h2>xxx<h2> .

  • Dimensione del set di dati: 692.72 MiB

  • Divisioni :

Diviso Esempi
'test' 611
'train' 11.005
'validation' 612
  • Struttura delle caratteristiche :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
fastfact Testo corda
evidenziare Testo corda
id Testo corda
data_pubblicata Testo corda
data_rilascio Testo corda
rapporto Testo corda
titolo Testo corda
URL Testo corda

gov_report/crs_json

  • Descrizione della configurazione : rapporto CRS con riepilogo. Strutture rappresentate come raw json.

  • Dimensione del set di dati: 361.92 MiB

  • Divisioni :

Diviso Esempi
'test' 362
'train' 6.514
'validation' 362
  • Struttura delle caratteristiche :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'reports': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
id Testo corda
data_rilascio Testo corda
rapporti Testo corda
riepilogo Testo corda
titolo Testo corda

gov_report/gao_json

  • Descrizione della configurazione : rapporto GAO con evidenziazione Strutture rappresentate come raw json.

  • Dimensione del set di dati: 712.82 MiB

  • Divisioni :

Diviso Esempi
'test' 611
'train' 11.005
'validation' 612
  • Struttura delle caratteristiche :
FeaturesDict({
    'fastfact': Text(shape=(), dtype=string),
    'highlight': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'published_date': Text(shape=(), dtype=string),
    'released_date': Text(shape=(), dtype=string),
    'report': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
fastfact Testo corda
evidenziare Testo corda
id Testo corda
data_pubblicata Testo corda
data_rilascio Testo corda
rapporto Testo corda
titolo Testo corda
URL Testo corda