- Description :
PASS est un ensemble de données d’images à grande échelle qui n’inclut aucun être humain, aucune partie humaine ou autre information personnellement identifiable. Il peut être utilisé pour une préformation auto-supervisée de haute qualité tout en réduisant considérablement les problèmes de confidentialité.
PASS contient 1 439 589 images sans aucune étiquette provenant du YFCC-100M.
Toutes les images de cet ensemble de données sont sous licence CC-BY, tout comme l'ensemble de données lui-même. Pour YFCC-100M, voir http://www.multimediacommons.org/
Documentation supplémentaire : Explorer sur les articles avec le code
Page d'accueil : https://www.robots.ox.ac.uk/~vgg/data/pass/
Code source :
tfds.datasets.pass.Builder
Versions :
-
1.0.0
: Version initiale. -
2.0.0
: v2 : Suppression de 472 images de la v1 car elles contenaient des humains. Métadonnées également ajoutées : date prise et GPS. -
3.0.0
(par défaut) : v3 : suppression de 131 images de la v2 car elles contenaient des humains/tatouages.
-
Taille du téléchargement :
167.30 GiB
Taille de l'ensemble de données :
166.43 GiB
Mise en cache automatique ( documentation ) : Non
Divisions :
Diviser | Exemples |
---|---|
'train' | 1 439 588 |
- Structure des fonctionnalités :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
image | Image | (Aucun, Aucun, 3) | uint8 | |
image/créateur_uname | Texte | chaîne | ||
image/date_prise | Texte | chaîne | ||
image/gps_lat | Tenseur | flotteur32 | ||
image/gps_lon | Tenseur | flotteur32 | ||
image/hachage | Texte | chaîne |
Clés supervisées (Voir doc
as_supervised
) :None
Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :
- Citation :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}