- 설명 :
데이터 세트에는 테이블-질문 쌍과 해당 답변이 포함되어 있습니다. 질문은 다단계 추론과 비교, 집계 및 산술 계산과 같은 다양한 데이터 작업이 필요합니다. 테이블은 최소 8개의 행과 5개의 열이 있는 Wikipedia 테이블 중에서 무작위로 선택되었습니다.
(문서 사용 참고 사항에 따름)
Dev: 훈련 데이터의 3개(5개 아님) 분할에 대한 평균 정확도입니다. 즉, 각각 'split-{1,2,3}-train'에서 학습하고 'split-{1,2,3}-dev'에서 테스트한 다음 정확도를 평균화합니다.
테스트: 'train'에서 학습하고 'test'에서 테스트합니다.
홈페이지 : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
소스 코드 :
tfds.structured.wiki_table_questions.WikiTableQuestions
버전 :
-
1.0.0
(기본값): 최초 릴리스.
-
다운로드 크기 :
65.36 MiB
데이터 세트 크기 :
237.24 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'split-1-dev' | 2,810 |
'split-1-train' | 11,321 |
'split-2-dev' | 2,838 |
'split-2-train' | 11,312 |
'split-3-dev' | 2,838 |
'split-3-train' | 11,311 |
'test' | 4,344 |
'train' | 14,149 |
- 기능 구조 :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
input_text | 풍모Dict | |||
입력_텍스트/컨텍스트 | 텐서 | 끈 | ||
입력_텍스트/테이블 | 순서 | |||
input_text/테이블/column_header | 텐서 | 끈 | ||
input_text/테이블/콘텐츠 | 텐서 | 끈 | ||
입력_텍스트/테이블/행_번호 | 텐서 | 정수16 | ||
target_text | 텐서 | 끈 |
감독 키 (
as_supervised
문서 참조):('input_text', 'target_text')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}