- Descrizione :
Dal documento: abbiamo raccolto automaticamente un set di dati di 5003 immagini dai famosi film di Hollywood. Le immagini sono state ottenute eseguendo un rilevatore di persone all'avanguardia su ogni decimo fotogramma di 30 film. Le persone rilevate con elevata sicurezza (circa 20.000 candidati) sono state quindi inviate al mercato di crowdsourcing Amazon Mechanical Turk per ottenere l'etichettatura di verità. Ogni immagine è stata annotata da cinque Turker per $ 0,01 ciascuna per etichettare 10 articolazioni della parte superiore del corpo. L'etichettatura mediana di cinque è stata presa in ciascuna immagine per essere robusta rispetto alle annotazioni anomale. Infine, le immagini venivano rifiutate manualmente da noi se la persona era occlusa o gravemente non frontale. Mettiamo da parte il 20% (1016 immagini) dei dati per i test.
Documentazione aggiuntiva : esplora documenti con codice
Home page : https://bensapp.github.io/flic-dataset.html
Codice sorgente :
tfds.datasets.flic.Builder
Versioni :
-
2.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del set di dati :
317.94 MiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'test' | 1.016 |
'train' | 3.987 |
- Struttura delle caratteristiche :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
currframe | Tensore | float64 | ||
Immagine | Immagine | (480, 720, 3) | uint8 | |
nomefilm | Testo | corda | ||
poselet_hit_idx | Sequenza (Tensore) | (Nessuno,) | uint16 | |
torsobox | Funzione BBox | (4,) | float32 | |
xcoords | Sequenza (Tensore) | (Nessuno,) | float64 | |
ycoords | Sequenza (Tensore) | (Nessuno,) | float64 |
Chiavi supervisionate (vedi il documento
as_supervised
):None
Citazione :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (configurazione predefinita)
Descrizione configurazione : utilizza gli esempi 5003 utilizzati nel documento MODEC CVPR13.
Dimensione download :
286.35 MiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
flic/pieno
Descrizione configurazione : utilizza 20928 esempi, un superset di FLIC costituito da esempi più difficili.
Dimensione download :
1.10 GiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):