- Descrição :
O conjunto de dados Dmlab contém frames observados pelo agente atuando no ambiente DeepMind Lab, que são anotados pela distância entre o agente e diversos objetos presentes no ambiente. O objetivo é avaliar a capacidade de um modelo visual de raciocinar sobre distâncias da entrada visual em ambientes 3D. O conjunto de dados Dmlab consiste em imagens coloridas de 360x480 em 6 classes. As classes são {perto, longe, muito longe} x {recompensa positiva, recompensa negativa} respectivamente.
Página inicial : https://github.com/google-research/task_adaptation
Código fonte :
tfds.image_classification.Dmlab
Versões :
-
2.0.1
(padrão): Sem notas de versão.
-
Tamanho do download :
2.81 GiB
Tamanho do conjunto de dados :
3.13 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 22.735 |
'train' | 65.550 |
'validation' | 22.628 |
- Estrutura de recursos :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(360, 480, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
nome do arquivo | Texto | corda | ||
imagem | Imagem | (360, 480, 3) | uint8 | |
rótulo | ClassLabel | int64 |
Chaves supervisionadas (consulte o documento
as_supervised
):('image', 'label')
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
@article{zhai2019visual,
title={The Visual Task Adaptation Benchmark},
author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
Michael Tschannen and Marcin Michalski and Olivier Bousquet and
Sylvain Gelly and Neil Houlsby},
year={2019},
eprint={1910.04867},
archivePrefix={arXiv},
primaryClass={cs.CV},
url = {https://arxiv.org/abs/1910.04867}
}