- Mô tả :
QUALITY, một bộ dữ liệu đọc hiểu dài, trắc nghiệm.
Chúng tôi chỉ cung cấp phiên bản thô.
Trang chủ : https://github.com/nyu-mll/quality
Mã nguồn :
tfds.datasets.quality.Builder
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
17.26 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Cấu trúc tính năng :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
mạo từ | Chữ | chuỗi | ||
ID bài viết | Chữ | chuỗi | ||
khó khăn | Trình tự (Tensor) | (Không có,) | bool | |
nhãn vàng | Trình tự (Tensor) | (Không có,) | int32 | |
tùy chọn | Trình tự(Trình tự(Văn bản)) | (Không có, không có) | chuỗi | |
câu hỏi_id | Trình tự (Văn bản) | (Không có,) | chuỗi | |
câu hỏi | Trình tự (Văn bản) | (Không có,) | chuỗi | |
set_unique_id | Chữ | chuỗi | ||
nguồn | Chữ | chuỗi | ||
Tiêu đề | Chữ | chuỗi | ||
đề tài | Chữ | chuỗi | ||
url | Chữ | chuỗi | ||
nhà văn_id | Chữ | chuỗi | ||
nhà văn_nhãn | Trình tự (Tensor) | (Không có,) | int32 |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
chất lượng/thô (cấu hình mặc định)
Mô tả cấu hình : Nguyên với HTML.
Kích thước tập dữ liệu :
22.18 MiB
Ví dụ ( tfds.as_dataframe ):
chất lượng / tước
Mô tả cấu hình : Đã loại bỏ HTML.
Kích thước tập dữ liệu :
20.73 MiB
Ví dụ ( tfds.as_dataframe ):