Conozca lo último en aprendizaje automático, IA generativa y más en el Simposio WiML 2023.

Esta página se ha traducido con Cloud Translation API.

voz

Descripción :

Este conjunto de datos contiene los datos del PASCAL Visual Object Classes Challenge, correspondiente a las competencias de Clasificación y Detección.

En la competencia de Clasificación, el objetivo es predecir el conjunto de etiquetas contenidas en la imagen, mientras que en la competencia de Detección el objetivo es predecir el cuadro delimitador y la etiqueta de cada objeto individual. ADVERTENCIA: Según el conjunto de datos oficial, el conjunto de prueba de VOC2012 no contiene anotaciones.

Documentación adicional : Explorar en artículos con código
Código fuente : tfds.object_detection.Voc
Versiones :
- 5.0.0 (predeterminado) : sin notas de versión.
Almacenamiento en caché automático ( documentación ): No
Estructura de características :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
    'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_difficult': bool,
        'is_truncated': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
    }),
})

Documentación de funciones :

Característica	Clase	Forma	tipo D
	FuncionesDict
imagen	Imagen	(Ninguno, Ninguno, 3)	uint8
imagen/nombre de archivo	Texto		cadena
etiquetas	Secuencia (etiqueta de clase)	(Ninguno,)	int64
etiquetas_no_difíciles	Secuencia (etiqueta de clase)	(Ninguno,)	int64
objetos	Secuencia
objetos/caja	Característica BBox	(4,)	flotador32
objetos/es_difícil	Tensor		booleano
objetos/está_truncado	Tensor		booleano
objetos/etiqueta	Etiqueta de clase		int64
objetos/pose	Etiqueta de clase		int64

Claves supervisadas (ver documento as_supervised ): None

voc/2007 (configuración predeterminada)

Descripción de la configuración : este conjunto de datos contiene los datos del PASCAL Visual Object Classes Challenge 2007, también conocido como VOC2007.

En este conjunto de datos se incluyen un total de 9963 imágenes, donde cada imagen contiene un conjunto de objetos, de 20 clases diferentes, lo que hace un total de 24640 objetos anotados.

Página de inicio : http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
Tamaño de descarga : 868.85 MiB
Tamaño del conjunto de datos : 837.73 MiB
Divisiones :

Dividir	Ejemplos
`'test'`	4.952
`'train'`	2.501
`'validation'`	2,510

Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

Cita :

@misc{pascal-voc-2007,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}

voc/2012

Descripción de la configuración : este conjunto de datos contiene los datos del PASCAL Visual Object Classes Challenge 2012, también conocido como VOC2012.

En este conjunto de datos se incluyen un total de 11540 imágenes, donde cada imagen contiene un conjunto de objetos, de 20 clases diferentes, lo que hace un total de 27450 objetos anotados.

Página de inicio : http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
Tamaño de descarga : 3.59 GiB
Tamaño del conjunto de datos : 2.44 GiB
Divisiones :

Dividir	Ejemplos
`'test'`	10,991
`'train'`	5.717
`'validation'`	5.823

Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

Cita :

@misc{pascal-voc-2012,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}

voz Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

voc/2007 (configuración predeterminada)

voc/2012

voz