Visualización : Explore en Know Your Data
Descripción :
Del periódico: recopilamos automáticamente un conjunto de datos de imágenes 5003 de películas populares de Hollywood. Las imágenes se obtuvieron ejecutando un detector de personas de última generación en cada décimo cuadro de 30 películas. Las personas detectadas con alta confianza (alrededor de 20 000 candidatos) se enviaron al mercado de crowdsourcing Amazon Mechanical Turk para obtener el etiquetado de la verdad. Cada imagen fue anotada por cinco Turkers por $0.01 cada uno para etiquetar 10 articulaciones de la parte superior del cuerpo. El etiquetado de la mediana de cinco se tomó en cada imagen para que fuera robusto a la anotación de valores atípicos. Finalmente, las imágenes fueron rechazadas manualmente por nosotros si la persona estaba ocluida o severamente no frontal. Reservamos el 20 % (1016 imágenes) de los datos para las pruebas.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://bensapp.github.io/flic-dataset.html
Código fuente :
tfds.datasets.flic.Builder
Versiones :
-
2.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño del conjunto de datos :
317.94 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 1,016 |
'train' | 3,987 |
- Estructura de características :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
currframe | Tensor | flotar64 | ||
imagen | Imagen | (480, 720, 3) | uint8 | |
nombre de pelicula | Texto | cuerda | ||
poselet_hit_idx | Secuencia (tensor) | (Ninguna,) | uint16 | |
caja del torso | BBoxCaracterística | (4,) | flotar32 | |
xcoords | Secuencia (tensor) | (Ninguna,) | flotar64 | |
ycoords | Secuencia (tensor) | (Ninguna,) | flotar64 |
Claves supervisadas (Ver
as_supervised
doc ):None
Cita :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/pequeño (configuración predeterminada)
Descripción de la configuración : utiliza 5003 ejemplos utilizados en el documento MODEC CVPR13.
Tamaño de la descarga :
286.35 MiB
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
flic/completo
Descripción de la configuración : utiliza 20928 ejemplos, un superconjunto de FLIC que consta de ejemplos más difíciles.
Tamaño de descarga :
1.10 GiB
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):