- 설명 :
7,787개의 실제 초등학교 수준의 객관식 과학 질문으로 구성된 새로운 데이터 세트는 고급 질의 응답 연구를 장려하기 위해 모였습니다. 데이터 세트는 챌린지 세트와 쉬운 세트로 분할되며 전자는 검색 기반 알고리즘과 단어 동시 발생 알고리즘 모두에 의해 잘못 답변된 질문만 포함합니다. 또한 작업과 관련된 1,400만 개 이상의 과학 문장 모음과 이 데이터 세트에 대한 3개의 신경 기준 모델 구현을 포함하고 있습니다. 우리는 ARC를 커뮤니티에 대한 도전 과제로 제시합니다.
홈페이지 : https://allenai.org/data/arc
소스 코드 :
tfds.datasets.ai2_arc.Builder
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
649.30 MiB
자동 캐시 ( 문서 ): 예
기능 구조 :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=5),
'choices': Sequence({
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
'text': Text(shape=(), dtype=string),
}),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
답변키 | 클래스 레이블 | int64 | ||
선택 | 순서 | |||
선택/라벨 | 클래스 레이블 | int64 | ||
선택/텍스트 | 텍스트 | 끈 | ||
ID | 텍스트 | 끈 | ||
의문 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@article{allenai:arc,
author = {Peter Clark and Isaac Cowhey and Oren Etzioni and Tushar Khot and
Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
title = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
journal = {arXiv:1803.05457v1},
year = {2018},
}
ai2_arc/ARC-Challenge(기본 구성)
구성 설명 : 2590개의 "어려운" 질문으로 구성된 챌린지 세트(검색 및 동시 발생 방법 모두 올바르게 대답하지 못하는 질문)
데이터 세트 크기 :
939.91 KiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,172 |
'train' | 1,119 |
'validation' | 299 |
- 예 ( tfds.as_dataframe ):
ai2_arc/ARC-이지
구성 설명 : ARC 챌린지에 대한 쉬운 5197개의 질문 세트입니다.
데이터 세트 크기 :
1.63 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 2,376 |
'train' | 2,251 |
'validation' | 570 |
- 예 ( tfds.as_dataframe ):