- Descriptif :
BillSum, résumé des projets de loi du Congrès américain et de l'État de Californie.
Il existe plusieurs fonctionnalités : - texte : texte de la facture. - récapitulatif : récapitulatif des factures. - titre : titre des factures. caractéristiques pour nous factures. ca n'a pas de factures. - text_len : nombre de caractères dans le texte. - sum_len : nombre de caractères dans le résumé.
Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : https://github.com/FiscalNote/BillSum
Code source :
tfds.datasets.billsum.Builder
Versions :
-
3.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
64.14 MiB
Taille du jeu de données :
260.84 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'ca_test' | 1 237 |
'test' | 3 269 |
'train' | 18 949 |
- Structure des fonctionnalités :
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
sommaire | Texte | chaîne de caractères | ||
texte | Texte | chaîne de caractères | ||
Titre | Texte | chaîne de caractères |
Touches supervisées (Voir
as_supervised
doc ):('text', 'summary')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}