경주

설명 :

Race는 28,000개 이상의 구절과 거의 100,000개의 질문이 있는 대규모 읽기 이해 데이터 세트입니다. 데이터 세트는 중학생 및 고등학생을 위해 설계된 중국의 영어 시험에서 수집되었습니다. 데이터 세트는 기계 이해를 위한 훈련 및 테스트 세트로 제공될 수 있습니다.

추가 문서 : 코드가 있는 논문에서 탐색
구성 설명 : RACE 데이터 세트용 빌더 구성입니다.
홈페이지 : https://www.cs.cmu.edu/~glai1/data/race/
소스 코드 : tfds.datasets.race.Builder
버전 :
- 1.0.0 : 최초 릴리스.
- 2.0.0 (기본값): 예제 ID를 추가합니다.
다운로드 크기 : 24.26 MiB
자동 캐시 ( 문서 ): 예
기능 구조 :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})

기능 문서 :

특징	수업	모양	D타입
	풍모Dict
답변	시퀀스(텍스트)	(없음,)	끈
기사	텍스트		끈
example_id	텍스트		끈
옵션	시퀀스(시퀀스(텍스트))	(없음, 없음)	끈
질문	시퀀스(텍스트)	(없음,)	끈

감독된 키 ( as_supervised 문서 참조): None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :

@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

레이스/높음(기본 구성)

데이터 세트 크기 : 52.39 MiB
분할 :

나뉘다	예
`'dev'`	1,021
`'test'`	1,045
`'train'`	18,728

예 ( tfds.as_dataframe ):

인종/중간

데이터 세트 크기 : 12.51 MiB
분할 :

나뉘다	예
`'dev'`	368
`'test'`	362
`'train'`	6,409

예 ( tfds.as_dataframe ):

경주 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

레이스/높음(기본 구성)

인종/중간

경주