- Descrizione :
PASS è un set di dati di immagini su larga scala che non include esseri umani, parti umane o altre informazioni di identificazione personale. Può essere utilizzato per una formazione preliminare autosuperata di alta qualità, riducendo significativamente i problemi di privacy.
PASS contiene 1.439.589 immagini senza etichette provenienti da YFCC-100M.
Tutte le immagini in questo set di dati sono concesse in licenza CC-BY, così come il set di dati stesso. Per YFCC-100M vedere http://www.multimediacommons.org/
Documentazione aggiuntiva : esplora documenti con codice
Pagina iniziale : https://www.robots.ox.ac.uk/~vgg/data/pass/
Codice sorgente :
tfds.datasets.pass.Builder
Versioni :
-
1.0.0
: versione iniziale. -
2.0.0
: v2: rimosse 472 immagini dalla v1 poiché contenevano esseri umani. Aggiunti anche metadati: data di acquisizione e GPS. -
3.0.0
(impostazione predefinita): v3: rimosse 131 immagini dalla v2 poiché contenevano esseri umani/tatuaggi.
-
Dimensione download :
167.30 GiB
Dimensione del set di dati :
166.43 GiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'train' | 1.439.588 |
- Struttura delle caratteristiche :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
immagine/nome_creatore | Testo | corda | ||
immagine/data_scattata | Testo | corda | ||
immagine/gps_lat | Tensore | float32 | ||
image/gps_lon | Tensore | float32 | ||
immagine/hash | Testo | corda |
Chiavi supervisionate (vedi il documento
as_supervised
):None
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
- Citazione :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}