- Descripción :
Este dataset contiene los datos del PASCAL Visual Object Classes Challenge, correspondientes a las competencias de Clasificación y Detección.
En la competencia de Clasificación, el objetivo es predecir el conjunto de etiquetas contenidas en la imagen, mientras que en la competencia de Detección, el objetivo es predecir el cuadro delimitador y la etiqueta de cada objeto individual. ADVERTENCIA: Según el conjunto de datos oficial, el conjunto de prueba de VOC2012 no contiene anotaciones.
Documentación adicional : Explore en Papers With Code
Código fuente :
tfds.object_detection.Voc
Versiones :
-
4.0.0
(predeterminado): Sin notas de la versión.
-
Almacenamiento automático en caché ( documentación ): No
Estructura de características :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
imagen/nombre de archivo | Texto | cuerda | ||
etiquetas | Secuencia (Etiqueta de clase) | (Ninguna,) | int64 | |
etiquetas_no_difícil | Secuencia (Etiqueta de clase) | (Ninguna,) | int64 | |
objetos | Secuencia | |||
objetos/bbox | BBoxCaracterística | (4,) | flotar32 | |
objetos/es_difícil | Tensor | bool | ||
objetos/está_truncado | Tensor | bool | ||
objetos/etiqueta | Etiqueta de clase | int64 | ||
objetos/pose | Etiqueta de clase | int64 |
- Claves supervisadas (Ver
as_supervised
doc ):None
voc/2007 (configuración predeterminada)
- Descripción de configuración : este conjunto de datos contiene los datos de PASCAL Visual Object Classes Challenge 2007, también conocido como VOC2007.
Se incluye un total de 9963 imágenes en este conjunto de datos, donde cada imagen contiene un conjunto de objetos, de 20 clases diferentes, lo que hace un total de 24640 objetos anotados.
Página de inicio: http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
Tamaño de la descarga :
868.85 MiB
Tamaño del conjunto de datos :
837.73 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 4,952 |
'train' | 2,501 |
'validation' | 2,510 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
voc/2012
- Descripción de configuración : este conjunto de datos contiene los datos de PASCAL Visual Object Classes Challenge 2012, también conocido como VOC2012.
Se incluye un total de 11540 imágenes en este conjunto de datos, donde cada imagen contiene un conjunto de objetos, de 20 clases diferentes, lo que hace un total de 27450 objetos anotados.
Página de inicio: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
Tamaño de descarga :
3.59 GiB
Tamaño del conjunto de datos :
2.44 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 10,991 |
'train' | 5,717 |
'validation' | 5,823 |
- Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}