Conozca lo último en aprendizaje automático, IA generativa y más en el Simposio WiML 2023.

Se usó la API de Cloud Translation para traducir esta página.

película

Visualización : Explore en Know Your Data
Descripción :

Del periódico: recopilamos automáticamente un conjunto de datos de imágenes 5003 de películas populares de Hollywood. Las imágenes se obtuvieron ejecutando un detector de personas de última generación en cada décimo cuadro de 30 películas. Las personas detectadas con alta confianza (alrededor de 20 000 candidatos) se enviaron al mercado de crowdsourcing Amazon Mechanical Turk para obtener el etiquetado de la verdad. Cada imagen fue anotada por cinco Turkers por $0.01 cada uno para etiquetar 10 articulaciones de la parte superior del cuerpo. El etiquetado de la mediana de cinco se tomó en cada imagen para que fuera robusto a la anotación de valores atípicos. Finalmente, las imágenes fueron rechazadas manualmente por nosotros si la persona estaba ocluida o severamente no frontal. Reservamos el 20 % (1016 imágenes) de los datos para las pruebas.

Documentación adicional : Explore en Papers With Code
Página de inicio: https://bensapp.github.io/flic-dataset.html
Código fuente : tfds.datasets.flic.Builder
Versiones :
- 2.0.0 (predeterminado): Sin notas de la versión.
Tamaño del conjunto de datos : 317.94 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'test'`	1,016
`'train'`	3,987

Estructura de características :

FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
currframe	Tensor		flotar64
imagen	Imagen	(480, 720, 3)	uint8
nombre de pelicula	Texto		cuerda
poselet_hit_idx	Secuencia (tensor)	(Ninguna,)	uint16
caja del torso	BBoxCaracterística	(4,)	flotar32
xcoords	Secuencia (tensor)	(Ninguna,)	flotar64
ycoords	Secuencia (tensor)	(Ninguna,)	flotar64

Claves supervisadas (Ver as_supervised doc ): None
Cita :

@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/pequeño (configuración predeterminada)

Descripción de la configuración : utiliza 5003 ejemplos utilizados en el documento MODEC CVPR13.
Tamaño de la descarga : 286.35 MiB
Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

flic/completo

Descripción de la configuración : utiliza 20928 ejemplos, un superconjunto de FLIC que consta de ejemplos más difíciles.
Tamaño de descarga : 1.10 GiB
Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

película Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

flic/pequeño (configuración predeterminada)

flic/completo

película