- 설명 :
데이터 세트에는 5,957개의 4방향 객관식 질문이 포함되어 있습니다. 또한 5,167개의 크라우드 소싱 상식 사실과 각 질문이 원래 핵심 사실, 사람의 정확도 점수, 명확성 점수 및 익명의 크라우드 작업자와 관련된 확장된 버전의 학습/개발/테스트 질문을 제공합니다. ID.
홈페이지 : https://leaderboard.allenai.org/open_book_qa/submissions/get-started
소스 코드 :
tfds.datasets.openbookqa.Builder
버전 :
-
0.1.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
1.38 MiB
데이터 세트 크기 :
2.40 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'test' | 500 |
'train' | 4,957 |
'validation' | 500 |
- 기능 구조 :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
'clarity': float32,
'fact1': Text(shape=(), dtype=string),
'humanScore': float32,
'question': FeaturesDict({
'choice_A': Text(shape=(), dtype=string),
'choice_B': Text(shape=(), dtype=string),
'choice_C': Text(shape=(), dtype=string),
'choice_D': Text(shape=(), dtype=string),
'stem': Text(shape=(), dtype=string),
}),
'turkIdAnonymized': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
답변키 | 클래스 레이블 | int64 | ||
명쾌함 | 텐서 | float32 | ||
사실1 | 텍스트 | 끈 | ||
휴먼스코어 | 텐서 | float32 | ||
의문 | 풍모Dict | |||
질문/선택_A | 텍스트 | 끈 | ||
질문/선택_B | 텍스트 | 끈 | ||
질문/선택_C | 텍스트 | 끈 | ||
질문/선택_D | 텍스트 | 끈 | ||
질문/줄기 | 텍스트 | 끈 | ||
turkId익명화됨 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('question', 'answerKey')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@article{mihaylov2018can,
title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
journal={arXiv preprint arXiv:1809.02789},
year={2018}
}