- Description :
L'ensemble de données CIFAR-10.1 est un nouvel ensemble de tests pour CIFAR-10. CIFAR-10.1 contient environ 2 000 nouvelles images de test qui ont été échantillonnées après plusieurs années de recherche sur l’ensemble de données original CIFAR-10. La collecte de données pour CIFAR-10.1 a été conçue pour minimiser les changements de distribution par rapport à l'ensemble de données d'origine. Nous décrivons la création de CIFAR-10.1 dans l'article « Les classificateurs CIFAR-10 se généralisent-ils au CIFAR-10 ? ». Les images de CIFAR-10.1 sont un sous-ensemble de l'ensemble de données TinyImages. Il existe actuellement deux versions de l'ensemble de données CIFAR-10.1 : v4 et v6.
Page d'accueil : https://github.com/modestyachts/CIFAR-10.1
Code source :
tfds.image_classification.Cifar10_1
Versions :
-
1.1.0
(par défaut) : Aucune note de version.
-
Mise en cache automatique ( documentation ) : Oui
Structure des fonctionnalités :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
image | Image | (32, 32, 3) | uint8 | |
étiquette | Étiquette de classe | int64 |
Clés supervisées (Voir doc
as_supervised
) :('image', 'label')
Citation :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (configuration par défaut)
Description de la configuration : C'est la première version de notre jeu de données sur laquelle nous avons testé n'importe quel classificateur. Comme mentionné ci-dessus, cela rend l'ensemble de données v4 indépendant des classificateurs que nous évaluons. Les chiffres rapportés dans les sections principales de notre article utilisent cette version de l'ensemble de données. Il a été construit à partir des 25 meilleurs mots-clés TinyImages pour chaque classe, ce qui a entraîné un léger déséquilibre de classe. La plus grande différence est que les vaisseaux ne représentent que 8 % de l’ensemble de test au lieu de 10 %. La v4 contient 2 021 images.
Taille du téléchargement :
5.93 MiB
Taille de l'ensemble de données :
4.46 MiB
Divisions :
Diviser | Exemples |
---|---|
'test' | 2 021 |
- Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :
cifar10_1/v6
Description de la configuration : Elle est dérivée d'une allocation de mots-clés légèrement améliorée qui est exactement équilibrée entre les classes. Cette version de l'ensemble de données correspond aux résultats de l'annexe D de notre article. La v6 contient 2 000 images.
Taille du téléchargement :
5.87 MiB
Taille du jeu de données :
4.40 MiB
Divisions :
Diviser | Exemples |
---|---|
'test' | 2 000 |
- Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :