Visualización : Explore en Know Your Data
Descripción :
Kitti contiene un conjunto de tareas de visión creadas con una plataforma de conducción autónoma. El punto de referencia completo contiene muchas tareas, como estéreo, flujo óptico, odometría visual, etc. Este conjunto de datos contiene el conjunto de datos de detección de objetos, incluidas las imágenes monoculares y los cuadros delimitadores. El conjunto de datos contiene 7481 imágenes de entrenamiento anotadas con cuadros delimitadores 3D. Puede encontrar una descripción completa de las anotaciones en el archivo Léame del kit de desarrollo de objetos en la página de inicio de Kitti.
Documentación adicional : Explore en Papers With Code
Página de inicio : http://www.cvlibs.net/datasets/kitti/
Código fuente :
tfds.datasets.kitti.Builder
Versiones :
-
3.1.0
: Sin notas de la versión. -
3.2.0
: Kit de desarrollo actualizado. -
3.3.0
(predeterminado): Se agregaron etiquetas para la funciónoccluded
.
-
Tamaño de descarga :
11.71 GiB
Tamaño del conjunto de datos :
5.27 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 711 |
'train' | 6,347 |
'validation' | 423 |
- Estructura de características :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'dimensions': Tensor(shape=(3,), dtype=float32),
'location': Tensor(shape=(3,), dtype=float32),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
imagen/nombre_de_archivo | Texto | cuerda | ||
objetos | Secuencia | |||
objetos/alfa | Tensor | flotar32 | Ángulo de observación del objeto, rango [-pi..pi] | |
objetos/bbox | BBoxCaracterística | (4,) | flotar32 | Cuadro delimitador 2D de objeto en la imagen |
objetos/dimensiones | Tensor | (3,) | flotar32 | Dimensiones del objeto 3D: alto, ancho, largo (en metros) |
objetos/ubicación | Tensor | (3,) | flotar32 | Ubicación de objetos 3D x,y,z en coordenadas de cámara (en metros) |
objetos/ocluidos | Etiqueta de clase | int64 | Número entero (0,1,2,3) que indica el estado de oclusión: 0 = totalmente visible, 1 = parcialmente ocluido 2 = en gran parte ocluido, 3 = desconocido | |
objetos/rotación_y | Tensor | flotar32 | Rotación ry alrededor del eje Y en coordenadas de cámara [-pi..pi] | |
objetos/truncado | Tensor | flotar32 | Flotante de 0 (no truncado) a 1 (truncado), donde truncado se refiere al objeto que sale de los límites de la imagen | |
objetos/tipo | Etiqueta de clase | int64 | El tipo de objeto, por ejemplo, 'Coche' o 'Van' |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}