laboratorio

  • Descripción :

El conjunto de datos de Dmlab contiene fotogramas observados por el agente que actúa en el entorno de DeepMind Lab, que están anotados por la distancia entre el agente y varios objetos presentes en el entorno. El objetivo es evaluar la capacidad de un modelo visual para razonar sobre distancias desde la entrada visual en entornos 3D. El conjunto de datos de Dmlab consta de imágenes en color de 360x480 en 6 clases. Las clases son {cerca, lejos, muy lejos} x {recompensa positiva, recompensa negativa} respectivamente.

Dividir Ejemplos
'test' 22.735
'train' 65.550
'validation' 22.628
  • Estructura de características :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
Nombre del archivo Texto cadena
imagen Imagen (360, 480, 3) uint8
etiqueta Etiqueta de clase int64

Visualización

  • Citación :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }