- Mô tả :
Trả lời câu hỏi trong ngữ cảnh là một bộ dữ liệu để lập mô hình, hiểu và tham gia vào hộp thoại tìm kiếm thông tin. Các phiên bản dữ liệu bao gồm một hộp thoại tương tác giữa hai nhân viên đám đông: (1) một sinh viên đặt ra một chuỗi các câu hỏi dạng tự do để tìm hiểu càng nhiều càng tốt về một văn bản Wikipedia ẩn và (2) một giáo viên trả lời các câu hỏi bằng cách cung cấp các đoạn trích ngắn (kéo dài) từ văn bản. QuAC đưa ra những thách thức không tìm thấy trong bộ dữ liệu hiểu máy hiện có: các câu hỏi của nó thường có kết thúc mở hơn, không thể trả lời hoặc chỉ có ý nghĩa trong ngữ cảnh hộp thoại.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://quac.ai/
Mã nguồn :
tfds.datasets.quac.Builder
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
73.47 MiB
Kích thước tập dữ liệu :
298.04 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 83,568 |
'validation' | 7,354 |
- Cấu trúc tính năng :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'background': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'followup': Text(shape=(), dtype=string),
'orig_answer': FeaturesDict({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'section_title': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'yesno': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
câu trả lời | Sự nối tiếp | |||
câu trả lời/answer_start | tenxơ | int32 | ||
câu trả lời/văn bản | Chữ | chuỗi | ||
lai lịch | Chữ | chuỗi | ||
bối cảnh | Chữ | chuỗi | ||
theo sát | Chữ | chuỗi | ||
orig_answer | Tính năngDict | |||
orig_answer/answer_start | tenxơ | int32 | ||
orig_answer/văn bản | Chữ | chuỗi | ||
câu hỏi | Chữ | chuỗi | ||
phần_tiêu đề | Chữ | chuỗi | ||
Tiêu đề | Chữ | chuỗi | ||
có không | Chữ | chuỗi |
Các khóa được giám sát (Xem
as_supervised
doc ):('context', 'answers')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@article{choi2018quac,
title={Quac: Question answering in context},
author={Choi, Eunsol and He, He and Iyyer, Mohit and Yatskar, Mark and Yih, Wen-tau and Choi, Yejin and Liang, Percy and Zettlemoyer, Luke},
journal={arXiv preprint arXiv:1808.07036},
year={2018}
}