- 설명 :
Question Answering in Context는 정보 탐색 대화를 모델링, 이해 및 참여하기 위한 데이터 세트입니다. 데이터 인스턴스는 두 크라우드 작업자 간의 대화형 대화로 구성됩니다. (1) 숨겨진 Wikipedia 텍스트에 대해 가능한 한 많은 것을 배우기 위해 일련의 자유 형식 질문을 하는 학생 및 (2) 짧은 발췌문을 제공하여 질문에 답하는 교사 (스팬) 텍스트에서. QuAC는 기존 기계 이해 데이터 세트에서 찾을 수 없는 문제를 도입합니다. 그 질문은 종종 더 개방적이고 대답할 수 없거나 대화 컨텍스트 내에서만 의미가 있습니다.
홈페이지 : https://quac.ai/
소스 코드 :
tfds.datasets.quac.Builder
버전 :
-
1.0.0
(기본값): 최초 릴리스.
-
다운로드 크기 :
73.47 MiB
데이터 세트 크기 :
298.04 MiB
자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'train' | 83,568 |
'validation' | 7,354 |
- 기능 구조 :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'background': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'followup': Text(shape=(), dtype=string),
'orig_answer': FeaturesDict({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'section_title': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'yesno': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
답변 | 순서 | |||
답변/answer_start | 텐서 | int32 | ||
답변/텍스트 | 텍스트 | 끈 | ||
배경 | 텍스트 | 끈 | ||
문맥 | 텍스트 | 끈 | ||
후속 조치 | 텍스트 | 끈 | ||
orig_answer | 풍모Dict | |||
orig_answer/answer_start | 텐서 | int32 | ||
orig_answer/텍스트 | 텍스트 | 끈 | ||
문제 | 텍스트 | 끈 | ||
section_title | 텍스트 | 끈 | ||
제목 | 텍스트 | 끈 | ||
예 아니오 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('context', 'answers')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@article{choi2018quac,
title={Quac: Question answering in context},
author={Choi, Eunsol and He, He and Iyyer, Mohit and Yatskar, Mark and Yih, Wen-tau and Choi, Yejin and Liang, Percy and Zettlemoyer, Luke},
journal={arXiv preprint arXiv:1808.07036},
year={2018}
}