- Opis :
ImageNet-R to zestaw obrazów oznaczonych etykietami ImageNet, które uzyskano poprzez kolekcjonowanie dzieł sztuki, kreskówek, deviantart, graffiti, haftów, grafiki, origami, obrazów, wzorów, przedmiotów plastikowych, pluszowych, rzeźb, szkiców, tatuaży, zabawek i wersje gier wideo klas ImageNet. ImageNet-R zawiera wersje 200 klas ImageNet, co daje 30 000 obrazów. poprzez zbieranie nowych danych i przechowywanie tylko tych obrazów, których modele ResNet-50 nie potrafią poprawnie sklasyfikować. Więcej szczegółów można znaleźć w artykule.
Przestrzeń etykiet jest taka sama jak w ImageNet2012. Każdy przykład jest reprezentowany jako słownik z następującymi kluczami:
- „obraz”: obraz, tensor (H, W, 3).
- „etykieta”: liczba całkowita z zakresu [0, 1000).
„nazwa_pliku”: Unikalne żądło identyfikujące przykład w zestawie danych.
Dodatkowa dokumentacja : Eksploruj w dokumentach z kodem
Strona główna : https://github.com/hendrycks/imagenet-r
Kod źródłowy :
tfds.datasets.imagenet_r.Builder
Wersje :
-
0.1.0
: Brak informacji o wydaniu. -
0.2.0
(domyślnie): Napraw nazwę_pliku, od ścieżki bezwzględnej do ścieżki względem katalogu imagenet-r, np.: „id_synsetu_obrazu/nazwa_pliku.jpg”.
-
Rozmiar pobierania :
2.04 GiB
Rozmiar zbioru danych :
2.02 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'test' | 30 000 |
- Struktura funkcji :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
Nazwa pliku | Tekst | strunowy | ||
obraz | Obraz | (Brak, Brak, 3) | uint8 | |
etykieta | Etykieta klasy | int64 |
Klucze nadzorowane (zobacz dokument
as_supervised
):('image', 'label')
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@article{hendrycks2020many,
title={The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution Generalization},
author={Dan Hendrycks and Steven Basart and Norman Mu and Saurav Kadavath and Frank Wang and Evan Dorundo and Rahul Desai and Tyler Zhu and Samyak Parajuli and Mike Guo and Dawn Song and Jacob Steinhardt and Justin Gilmer},
journal={arXiv preprint arXiv:2006.16241},
year={2020}
}