dmlab

  • Descrizione :

Il dataset Dmlab contiene frame osservati dall'agente che agisce nell'ambiente DeepMind Lab, che sono annotati dalla distanza tra l'agente e vari oggetti presenti nell'ambiente. L'obiettivo è valutare la capacità di un modello visivo di ragionare sulle distanze dall'input visivo in ambienti 3D. Il dataset Dmlab è costituito da immagini a colori 360x480 in 6 classi. Le classi sono rispettivamente {vicino, lontano, molto lontano} x {ricompensa positiva, ricompensa negativa}.

Diviso Esempi
'test' 22.735
'train' 65.550
'validation' 22.628
  • Struttura delle caratteristiche :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
nome del file Testo corda
Immagine Immagine (360, 480, 3) uint8
etichetta ClassLabel int64

Visualizzazione

  • Citazione :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }