dmlab

  • Description :

Le jeu de données Dmlab contient des images observées par l'agent agissant dans l'environnement DeepMind Lab, qui sont annotées par la distance entre l'agent et différents objets présents dans l'environnement. L'objectif est d'évaluer la capacité d'un modèle visuel à raisonner sur les distances par rapport à l'entrée visuelle dans des environnements 3D. L'ensemble de données Dmlab se compose d'images couleur 360 x 480 réparties en 6 classes. Les classes sont respectivement {proche, loin, très loin} x {récompense positive, récompense négative}.

Diviser Exemples
'test' 22 735
'train' 65 550
'validation' 22 628
  • Structure des fonctionnalités :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
nom de fichier Texte chaîne
image Image (360, 480, 3) uint8
étiquette Étiquette de classe int64

Visualisation

  • Citation :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }