- 설명 :
Cosmos QA는 객관식 질문으로 구성된 상식 기반 독해력이 필요한 35.6K 문제의 대규모 데이터 세트입니다. 그것은 맥락에서 정확한 텍스트 범위를 넘어서는 추론이 필요한 사건의 가능한 원인이나 결과에 관한 질문을 던지며 사람들의 일상 이야기의 다양한 컬렉션을 통해 행간 읽기에 중점을 둡니다.
소스 코드 :
tfds.question_answering.CosmosQA
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
23.27 MiB
데이터 세트 크기 :
27.09 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'test' | 6,963 |
'train' | 25,262 |
'validation' | 2,985 |
- 기능 구조 :
FeaturesDict({
'answer0': Text(shape=(), dtype=string),
'answer1': Text(shape=(), dtype=string),
'answer2': Text(shape=(), dtype=string),
'answer3': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=4),
'question': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
답변0 | 텍스트 | 끈 | ||
답변1 | 텍스트 | 끈 | ||
답변2 | 텍스트 | 끈 | ||
답3 | 텍스트 | 끈 | ||
문맥 | 텍스트 | 끈 | ||
ID | 텍스트 | 끈 | ||
상표 | 클래스 레이블 | int64 | ||
의문 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{huang-etal-2019-cosmos,
title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
author = "Huang, Lifu and
Le Bras, Ronan and
Bhagavatula, Chandra and
Choi, Yejin",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
year = "2019",
url = "https://www.aclweb.org/anthology/D19-1243"
}