- 설명 :
BillSum, 미국 의회 및 캘리포니아 주의 법안 요약.
몇 가지 기능이 있습니다. - 텍스트: 청구서 텍스트. - 요약: 청구서 요약. - 제목: 법안의 제목. 우리 청구서에 대한 기능. ca 청구서는 가지고 있지 않습니다. - text_len: 텍스트의 문자 수입니다. - sum_len: 요약된 문자 수입니다.
소스 코드 :
tfds.datasets.billsum.Builder
버전 :
-
3.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
64.14 MiB
데이터 세트 크기 :
260.84 MiB
자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'ca_test' | 1,237 |
'test' | 3,269 |
'train' | 18,949 |
- 기능 구조 :
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
요약 | 텍스트 | 끈 | ||
텍스트 | 텍스트 | 끈 | ||
제목 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('text', 'summary')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}