- Descrição :
Imagenet2012Subset é um subconjunto do conjunto de dados original ImageNet ILSVRC 2012. O conjunto de dados compartilha o mesmo conjunto de validação do conjunto de dados ImageNet ILSVRC 2012 original. No entanto, o conjunto de treinamento é subamostrado de forma balanceada. Na configuração 1pct
, 1%, ou 12.811, as imagens são amostradas, a maioria das classes tem o mesmo número de imagens (média 12,8), algumas classes têm aleatoriamente 1 exemplo a mais que outras; e na configuração 10pct
, ~10% ou 128116, a maioria das classes tem o mesmo número de imagens (média 128), e algumas classes têm aleatoriamente 1 exemplo a mais que outras.
Supõe-se que isso seja usado como referência para aprendizagem semissupervisionada e foi originalmente usado no artigo SimCLR ( https://arxiv.org/abs/2002.05709 ).
Página inicial : http://image-net.org/
Código fonte :
tfds.datasets.imagenet2012_subset.Builder
Versões :
-
2.0.0
: Corrija rótulos de validação. -
2.0.1
: Correção de codificação. Nenhuma alteração do ponto de vista do usuário. 3.0.0
: Corrige a colorização em aproximadamente 12 imagens (CMYK -> RGB). Corrija o formato para consistência (converta a imagem PNG única em JPEG). Leitura de geração mais rápida diretamente do arquivo.4.0.0
: (não publicado)5.0.0
(padrão): Nova API dividida ( https://tensorflow.org/datasets/splits )5.1.0
: Adicionada divisão de teste.
-
Instruções de download manual : este conjunto de dados requer que você baixe os dados de origem manualmente em
download_config.manual_dir
(o padrão é~/tensorflow_datasets/downloads/manual/
):
manual_dir deve conter dois arquivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Você precisa se registrar em https://image-net.org/download-images para obter o link para baixar o conjunto de dados.Armazenado em cache automaticamente ( documentação ): Não
Estrutura de recursos :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
nome do arquivo | Texto | corda | ||
imagem | Imagem | (Nenhum, Nenhum, 3) | uint8 | |
rótulo | ClassLabel | int64 |
Chaves supervisionadas (consulte o documento
as_supervised
):('image', 'label')
Citação :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (configuração padrão)
Descrição da configuração : 1pct do conjunto total de treinamento do ImageNet.
Tamanho do download :
254.22 KiB
Tamanho do conjunto de dados :
7.61 GiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 12.811 |
'validation' | 50.000 |
- Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
imagenet2012_subset/10pct
Descrição da configuração : 10% do conjunto total de treinamento do ImageNet.
Tamanho do download :
2.48 MiB
Tamanho do conjunto de dados :
19.91 GiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 128.116 |
'validation' | 50.000 |
- Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):