- Descrição :
PASS é um conjunto de dados de imagens em grande escala que não inclui seres humanos, partes humanas ou outras informações de identificação pessoal. Ele pode ser usado para pré-treinamento autosupervisionado de alta qualidade, ao mesmo tempo que reduz significativamente as preocupações com privacidade.
PASS contém 1.439.589 imagens sem rótulos provenientes do YFCC-100M.
Todas as imagens neste conjunto de dados são licenciadas sob a licença CC-BY, assim como o próprio conjunto de dados. Para YFCC-100M, consulte http://www.multimediacommons.org/
Documentação adicional : Explore artigos com código
Página inicial : https://www.robots.ox.ac.uk/~vgg/data/pass/
Código fonte :
tfds.datasets.pass.Builder
Versões :
-
1.0.0
: Versão inicial. -
2.0.0
: v2: Removidas 472 imagens da v1 porque continham humanos. Também foram adicionados metadados: data obtida e GPS. -
3.0.0
(padrão): v3: Removidas 131 imagens da v2 porque continham humanos/tatuagens.
-
Tamanho do download :
167.30 GiB
Tamanho do conjunto de dados :
166.43 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.439.588 |
- Estrutura de recursos :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
imagem | Imagem | (Nenhum, Nenhum, 3) | uint8 | |
imagem/creator_uname | Texto | corda | ||
imagem/data_tirada | Texto | corda | ||
imagem/gps_lat | Tensor | float32 | ||
imagem/gps_lon | Tensor | float32 | ||
imagem/hash | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):None
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}