dmlab

  • Sự miêu tả :

Bộ dữ liệu Dmlab chứa các khung được quan sát bởi tác nhân hoạt động trong môi trường DeepMind Lab, được chú thích bằng khoảng cách giữa tác nhân và các đối tượng khác nhau có trong môi trường. Mục tiêu là đánh giá khả năng của một mô hình trực quan trong việc suy luận về khoảng cách từ đầu vào hình ảnh trong môi trường 3D. Bộ dữ liệu Dmlab bao gồm các hình ảnh màu 360x480 được chia thành 6 lớp. Các lớp lần lượt là {gần, xa, rất xa} x {phần thưởng tích cực, phần thưởng tiêu cực}.

Tách ra Ví dụ
'test' 22.735
'train' 65.550
'validation' 22.628
  • Cấu trúc tính năng :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
tên tập tin Chữ sợi dây
hình ảnh Hình ảnh (360, 480, 3) uint8
nhãn Nhãn lớp int64

Hình dung

  • Trích dẫn :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }