- 설명 :
Eraser Multi RC는 답변 및 근거와 함께 여러 줄의 구절에 대한 쿼리를 위한 데이터 세트입니다. 이 데이터 세트의 각 예에는 다음 5개 부분이 있습니다.
- 다중 행 구절 2. 구절에 대한 질의 3. 질의에 대한 답변
- 정답 여부에 대한 분류 5. 분류를 정당화하는 설명
소스 코드 :
tfds.text.EraserMultiRc
버전 :
-
0.1.1
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
1.59 MiB
데이터 세트 크기 :
62.59 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'test' | 4,848 |
'train' | 24,029 |
'validation' | 3,214 |
- 기능 구조 :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
증거 | 시퀀스(텍스트) | (없음,) | 끈 | |
상표 | 클래스 레이블 | int64 | ||
통로 | 텍스트 | 끈 | ||
query_and_answer | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}