visage_large

  • Descriptif :

L'ensemble de données WIDER FACE est un ensemble de données de référence de détection de visage, dont les images sont sélectionnées à partir de l'ensemble de données WIDER accessible au public. Nous choisissons 32 203 images et étiquetons 393 703 visages avec un degré élevé de variabilité d'échelle, de pose et d'occlusion, comme illustré dans les exemples d'images. L'ensemble de données WIDER FACE est organisé sur la base de 61 classes d'événements. Pour chaque classe d'événement, nous sélectionnons au hasard 40 %/10 %/50 % de données comme ensembles d'entraînement, de validation et de test. Nous adoptons la même métrique d'évaluation utilisée dans l'ensemble de données PASCAL VOC. Comme pour les ensembles de données MALF et Caltech, nous ne publions pas la vérité terrain de la boîte englobante pour les images de test. Les utilisateurs sont tenus de soumettre des fichiers de prédiction finaux, que nous procéderons à l'évaluation.

Diviser Exemples
'test' 16 097
'train' 12 880
'validation' 3 226
  • Structure des fonctionnalités :
FeaturesDict({
    'faces': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'blur': uint8,
        'expression': bool,
        'illumination': bool,
        'invalid': bool,
        'occlusion': uint8,
        'pose': bool,
    }),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
visages Séquence
visages/bbox BBoxFeature (4,) float32
visages/flou Tenseur uint8
visages/expression Tenseur bourdonner
visages/illumination Tenseur bourdonner
visages/invalide Tenseur bourdonner
faces/occlusion Tenseur uint8
visages/pose Tenseur bourdonner
image Image (Aucun, Aucun, 3) uint8
image/nom de fichier Texte chaîne de caractères

Visualisation

  • Citation :
@inproceedings{yang2016wider,
    Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
    Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
    Title = {WIDER FACE: A Face Detection Benchmark},
    Year = {2016} }