- Mô tả :
BoolQ là bộ dữ liệu trả lời câu hỏi cho câu hỏi có/không chứa 15942 ví dụ. Những câu hỏi này xảy ra một cách tự nhiên, chúng được tạo ra trong các cài đặt không bị ràng buộc và không bị ràng buộc.
Mỗi ví dụ là một bộ ba (câu hỏi, đoạn văn, câu trả lời), với tiêu đề của trang là ngữ cảnh bổ sung tùy chọn. Thiết lập phân loại cặp văn bản tương tự như các tác vụ suy luận ngôn ngữ tự nhiên hiện có.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://github.com/google-research-datasets/boolean-questions
Mã nguồn :
tfds.datasets.bool_q.Builder
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
8.36 MiB
Kích thước tập dữ liệu :
8.51 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 9,427 |
'validation' | 3.270 |
- Cấu trúc tính năng :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
câu trả lời | tenxơ | bool | ||
đoạn văn | Chữ | sợi dây | ||
câu hỏi | Chữ | sợi dây | ||
Tiêu đề | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}