- 설명 :
기존 독해 벤치마크의 시스템 성능이 사람의 성능에 근접하거나 능가하는 상황에서 텍스트 단락을 실제로 읽을 수 있는 시스템의 기능을 향상시키는 새로운 하드 데이터 세트가 필요합니다. DROP은 적대적으로 생성된 96,000개 질문으로 구성된 크라우드 소싱 벤치마크로, 시스템은 질문에서 여러 입력 위치에 대한 참조를 해결하고 여기에 대해 개별 작업(예: 추가, 계산 또는 정렬)을 수행해야 합니다. 이러한 작업에는 이전 데이터 세트에 필요한 것보다 단락 내용에 대한 훨씬 더 포괄적인 이해가 필요합니다.
홈페이지 : https://allennlp.org/drop
소스 코드 :
tfds.text.drop.Drop
버전 :
-
1.0.0
: 최초 릴리스. -
2.0.0
(기본값): 답변에 대한 모든 옵션을 추가합니다.
-
다운로드 크기 :
7.92 MiB
데이터 세트 크기 :
116.24 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'dev' | 9,536 |
'train' | 77,409 |
- 기능 구조 :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'passage': Text(shape=(), dtype=string),
'query_id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'validated_answers': Sequence(Text(shape=(), dtype=string)),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
대답 | 텍스트 | 끈 | ||
통로 | 텍스트 | 끈 | ||
query_id | 텍스트 | 끈 | ||
의문 | 텍스트 | 끈 | ||
validation_answers | 시퀀스(텍스트) | (없음,) | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{Dua2019DROP,
author={Dheeru Dua and Yizhong Wang and Pradeep Dasigi and Gabriel Stanovsky and Sameer Singh and Matt Gardner},
title={ {DROP}: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs},
booktitle={Proc. of NAACL},
year={2019}
}