imagenet_v2

ImageNet-v2 é um conjunto de teste ImageNet (10 por classe) coletado seguindo de perto o protocolo de rotulagem original. Cada imagem foi rotulada por pelo menos 10 trabalhadores do MTurk, possivelmente mais, e dependendo da estratégia usada para selecionar quais imagens incluir entre as 10 escolhidas para determinada classe, existem três versões diferentes do conjunto de dados. Consulte a seção quatro do documento para obter mais detalhes sobre como as diferentes variantes foram compiladas.

O espaço do rótulo é o mesmo do ImageNet2012. Cada exemplo é representado como um dicionário com as seguintes chaves:

  • 'image': A imagem, um (H, W, 3)-tensor.
  • 'rótulo': Um número inteiro no intervalo [0, 1000).
  • 'file_name': Uma sequência única que identifica o exemplo dentro do conjunto de dados.

  • Página inicial : https://github.com/modestyachts/ImageNetV2

  • Código-fonte : tfds.datasets.imagenet_v2.Builder

  • Versões :

    • 1.0.0 : Versão inicial.
    • 2.0.0 : Arquivos atualizados.
    • 3.0.0 (padrão): Corrige file_name, do caminho absoluto para o caminho relativo ao diretório de dados, ou seja: "class_id/filename.jpg".
    • 3.1.0 : Novos URLs para recursos do Hugging Face.
  • Armazenado em cache automaticamente ( documentação ): Não

  • Divisões :

Dividir Exemplos
'test' 10.000
  • Estrutura de recursos :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentação do recurso :
Recurso Aula Forma Tipo D Descrição
RecursosDict
nome do arquivo Texto corda
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
rótulo ClassLabel int64
  • Chaves supervisionadas (Consulte as_supervised doc ): ('image', 'label')

  • Citação :

@inproceedings{recht2019imagenet,
  title={Do ImageNet Classifiers Generalize to ImageNet?},
  author={Recht, Benjamin and Roelofs, Rebecca and Schmidt, Ludwig and Shankar, Vaishaal},
  booktitle={International Conference on Machine Learning},
  pages={5389--5400},
  year={2019}
}

imagenet_v2/frequência combinada (configuração padrão)

  • Tamanho do download : 1.18 GiB

  • Tamanho do conjunto de dados : 1.16 GiB

  • Figura ( tfds.show_examples ):

Visualização

imagenet_v2/threshold-0.7

  • Tamanho do download : 1.16 GiB

  • Tamanho do conjunto de dados : 1.15 GiB

  • Figura ( tfds.show_examples ):

Visualização

imagenet_v2/topimages

  • Tamanho do download : 1.16 GiB

  • Tamanho do conjunto de dados : 1.14 GiB

  • Figura ( tfds.show_examples ):

Visualização