- Descripción :
PASS es un conjunto de datos de imágenes a gran escala que no incluye humanos, partes humanas ni otra información de identificación personal. Se puede utilizar para una formación previa autosupervisada de alta calidad y al mismo tiempo reducir significativamente los problemas de privacidad.
PASS contiene 1.439.589 imágenes sin etiquetas procedentes de YFCC-100M.
Todas las imágenes de este conjunto de datos tienen la licencia CC-BY, al igual que el propio conjunto de datos. Para YFCC-100M, consulte http://www.multimediacommons.org/
Documentación adicional : Explorar en artículos con código
Página de inicio : https://www.robots.ox.ac.uk/~vgg/data/pass/
Código fuente :
tfds.datasets.pass.Builder
Versiones :
-
1.0.0
: versión inicial. -
2.0.0
: v2: Se eliminaron 472 imágenes de v1 porque contenían humanos. También se agregaron metadatos: fecha de toma y GPS. -
3.0.0
(predeterminado): v3: Se eliminaron 131 imágenes de v2 porque contenían humanos/tatuajes.
-
Tamaño de descarga :
167.30 GiB
Tamaño del conjunto de datos :
166.43 GiB
Almacenamiento en caché automático ( documentación ): No
Divisiones :
Dividir | Ejemplos |
---|---|
'train' | 1.439.588 |
- Estructura de características :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
imagen/creador_uname | Texto | cadena | ||
imagen/fecha_tomada | Texto | cadena | ||
imagen/gps_lat | Tensor | flotador32 | ||
imagen/gps_lon | Tensor | flotador32 | ||
imagen/hash | Texto | cadena |
Claves supervisadas (ver documento
as_supervised
):None
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Citación :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}