cifar10_1

  • Descrição :

O conjunto de dados CIFAR-10.1 é um novo conjunto de testes para CIFAR-10. O CIFAR-10.1 contém cerca de 2.000 novas imagens de teste que foram amostradas após vários anos de pesquisa no conjunto de dados CIFAR-10 original. A recolha de dados para o CIFAR-10.1 foi concebida para minimizar a mudança de distribuição em relação ao conjunto de dados original. Descrevemos a criação do CIFAR-10.1 no artigo "Do CIFAR-10 Classifiers Generalize to CIFAR-10?". As imagens no CIFAR-10.1 são um subconjunto do conjunto de dados TinyImages. Existem atualmente duas versões do conjunto de dados CIFAR-10.1: v4 e v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
imagem Imagem (32, 32, 3) uint8
rótulo ClassLabel int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (configuração padrão)

  • Descrição da configuração : é a primeira versão do nosso conjunto de dados na qual testamos qualquer classificador. Conforme mencionado acima, isso torna o conjunto de dados v4 independente dos classificadores que avaliamos. Os números relatados nas seções principais do nosso artigo usam esta versão do conjunto de dados. Ele foi construído a partir das 25 principais palavras-chave do TinyImages para cada classe, o que levou a um ligeiro desequilíbrio de classe. A maior diferença é que os navios representam apenas 8% do conjunto de testes, em vez de 10%. v4 contém 2.021 imagens.

  • Tamanho do download : 5.93 MiB

  • Tamanho do conjunto de dados : 4.46 MiB

  • Divisões :

Dividir Exemplos
'test' 2.021

Visualização

cifar10_1/v6

  • Descrição da configuração : é derivado de uma alocação de palavras-chave ligeiramente melhorada que é exatamente balanceada por classe. Esta versão do conjunto de dados corresponde aos resultados do Apêndice D do nosso artigo. v6 contém 2.000 imagens.

  • Tamanho do download : 5.87 MiB

  • Tamanho do conjunto de dados : 4.40 MiB

  • Divisões :

Dividir Exemplos
'test' 2.000

Visualização