- Descripción :
Del artículo: Recopilamos automáticamente un conjunto de datos de 5003 imágenes de películas populares de Hollywood. Las imágenes se obtuvieron ejecutando un detector de personas de última generación en cada décimo fotograma de 30 películas. Las personas detectadas con gran confianza (aproximadamente 20.000 candidatos) fueron luego enviadas al mercado de crowdsourcing Amazon Mechanical Turk para obtener etiquetas de verdad. Cada imagen fue anotada por cinco Turkers por $0,01 cada uno para etiquetar 10 articulaciones de la parte superior del cuerpo. Se tomó el etiquetado de mediana de cinco en cada imagen para que fuera resistente a la anotación de valores atípicos. Finalmente, rechazamos manualmente las imágenes si la persona estaba ocluida o muy no frontal. Reservamos el 20% (1016 imágenes) de los datos para realizar pruebas.
Documentación adicional : Explorar en artículos con código
Página de inicio : https://bensapp.github.io/flic-dataset.html
Código fuente :
tfds.datasets.flic.Builder
Versiones :
-
2.0.0
(predeterminado): sin notas de la versión.
-
Tamaño del conjunto de datos :
317.94 MiB
Almacenamiento en caché automático ( documentación ): No
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 1.016 |
'train' | 3.987 |
- Estructura de características :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
marco actual | Tensor | flotador64 | ||
imagen | Imagen | (480, 720, 3) | uint8 | |
nombre de pelicula | Texto | cadena | ||
poselet_hit_idx | Secuencia (tensor) | (Ninguno,) | uint16 | |
caja del torso | Característica BBox | (4,) | flotador32 | |
xcoords | Secuencia (tensor) | (Ninguno,) | flotador64 | |
ycoords | Secuencia (tensor) | (Ninguno,) | flotador64 |
Claves supervisadas (ver documento
as_supervised
):None
Citación :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (configuración predeterminada)
Descripción de la configuración : utiliza 5003 ejemplos utilizados en el documento CVPR13 MODEC.
Tamaño de descarga :
286.35 MiB
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
película/completa
Descripción de la configuración : utiliza 20928 ejemplos, un superconjunto de FLIC que consta de ejemplos más difíciles.
Tamaño de descarga :
1.10 GiB
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):