flic

Descripción :

Del artículo: Recopilamos automáticamente un conjunto de datos de 5003 imágenes de películas populares de Hollywood. Las imágenes se obtuvieron ejecutando un detector de personas de última generación en cada décimo fotograma de 30 películas. Las personas detectadas con gran confianza (aproximadamente 20.000 candidatos) fueron luego enviadas al mercado de crowdsourcing Amazon Mechanical Turk para obtener etiquetas de verdad. Cada imagen fue anotada por cinco Turkers por $0,01 cada uno para etiquetar 10 articulaciones de la parte superior del cuerpo. Se tomó el etiquetado de mediana de cinco en cada imagen para que fuera resistente a la anotación de valores atípicos. Finalmente, rechazamos manualmente las imágenes si la persona estaba ocluida o muy no frontal. Reservamos el 20% (1016 imágenes) de los datos para realizar pruebas.

Documentación adicional : Explorar en artículos con código
Página de inicio : https://bensapp.github.io/flic-dataset.html
Código fuente : tfds.datasets.flic.Builder
Versiones :
- 2.0.0 (predeterminado): sin notas de la versión.
Tamaño del conjunto de datos : 317.94 MiB
Almacenamiento en caché automático ( documentación ): No
Divisiones :

Dividir	Ejemplos
`'test'`	1.016
`'train'`	3.987

Estructura de características :

FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})

Documentación de funciones :

Característica	Clase	Forma	tipo D
	FuncionesDict
marco actual	Tensor		flotador64
imagen	Imagen	(480, 720, 3)	uint8
nombre de pelicula	Texto		cadena
poselet_hit_idx	Secuencia (tensor)	(Ninguno,)	uint16
caja del torso	Característica BBox	(4,)	flotador32
xcoords	Secuencia (tensor)	(Ninguno,)	flotador64
ycoords	Secuencia (tensor)	(Ninguno,)	flotador64

Claves supervisadas (ver documento as_supervised ): None
Citación :

@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (configuración predeterminada)

Descripción de la configuración : utiliza 5003 ejemplos utilizados en el documento CVPR13 MODEC.
Tamaño de descarga : 286.35 MiB
Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

película/completa

Descripción de la configuración : utiliza 20928 ejemplos, un superconjunto de FLIC que consta de ejemplos más difíciles.
Tamaño de descarga : 1.10 GiB
Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

flic Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

flic/small (configuración predeterminada)

película/completa

flic