Visualización : Explore en Know Your Data
Descripción :
PASS es un conjunto de datos de imágenes a gran escala que no incluye seres humanos, partes humanas u otra información de identificación personal. Se puede utilizar para una formación previa autosupervisada de alta calidad al tiempo que reduce significativamente los problemas de privacidad.
PASS contiene 1 439 589 imágenes sin etiquetas provenientes de YFCC-100M.
Todas las imágenes de este conjunto de datos tienen licencia CC-BY, al igual que el propio conjunto de datos. Para YFCC-100M, consulte http://www.multimediacommons.org/
Documentación adicional : Explore en Papers With Code
Página de inicio: https://www.robots.ox.ac.uk/~vgg/data/pass/
Código fuente :
tfds.datasets.pass.Builder
Versiones :
-
1.0.0
: Versión inicial. -
2.0.0
: v2: Se eliminaron 472 imágenes de v1 porque contenían humanos. También se agregaron metadatos: datetaken y GPS. -
3.0.0
(predeterminado): v3: Se eliminaron 131 imágenes de v2 porque contenían humanos/tatuajes.
-
Tamaño de descarga :
167.30 GiB
Tamaño del conjunto de datos :
166.43 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,439,588 |
- Estructura de características :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
imagen/creator_uname | Texto | cuerda | ||
imagen/fecha_tomada | Texto | cuerda | ||
imagen/gps_lat | Tensor | flotar32 | ||
imagen/gps_lon | Tensor | flotar32 | ||
imagen/hash | Texto | cuerda |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}