- Description :
Extrait du journal : Nous avons collecté automatiquement un ensemble de données de 5 003 images à partir de films hollywoodiens populaires. Les images ont été obtenues en exécutant un détecteur de personne de pointe sur une image sur dix de 30 films. Les personnes détectées avec un niveau de confiance élevé (environ 20 000 candidats) ont ensuite été envoyées sur le marché de crowdsourcing Amazon Mechanical Turk pour obtenir un étiquetage de vérité sur le terrain. Chaque image a été annotée par cinq Turkers pour 0,01 $ chacun pour identifier 10 articulations du haut du corps. L'étiquetage médian sur cinq a été pris dans chaque image pour être robuste aux annotations aberrantes. Enfin, les images étaient rejetées manuellement par nos soins si la personne était occluse ou gravement non frontale. Nous avons réservé 20 % (1 016 images) des données pour les tests.
Documentation supplémentaire : Explorer sur les articles avec le code
Page d'accueil : https://bensapp.github.io/flic-dataset.html
Code source :
tfds.datasets.flic.Builder
Versions :
-
2.0.0
(par défaut) : Aucune note de version.
-
Taille de l'ensemble de données :
317.94 MiB
Mise en cache automatique ( documentation ) : Non
Divisions :
Diviser | Exemples |
---|---|
'test' | 1 016 |
'train' | 3 987 |
- Structure des fonctionnalités :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
cadre curr | Tenseur | flotteur64 | ||
image | Image | (480, 720, 3) | uint8 | |
nom du film | Texte | chaîne | ||
poselet_hit_idx | Séquence (Tenseur) | (Aucun,) | uint16 | |
torse | Fonctionnalité BBox | (4,) | flotteur32 | |
xcoords | Séquence (Tenseur) | (Aucun,) | flotteur64 | |
ycoords | Séquence (Tenseur) | (Aucun,) | flotteur64 |
Clés supervisées (Voir doc
as_supervised
) :None
Citation :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (configuration par défaut)
Description de la configuration : Utilise 5003 exemples utilisés dans l'article CVPR13 MODEC.
Taille du téléchargement :
286.35 MiB
Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :
flic/complet
Description de la configuration : Utilise 20928 exemples, un surensemble de FLIC composé d'exemples plus difficiles.
Taille du téléchargement :
1.10 GiB
Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :