- Opis :
Zbiór danych zwierząt domowych Oxford-IIIT to zbiór danych dotyczący zdjęć zwierząt domowych składający się z 37 kategorii i obejmujący około 200 zdjęć dla każdej klasy. Obrazy mają duże różnice w skali, pozach i oświetleniu. Wszystkie obrazy mają powiązaną adnotację dotyczącą rasy i gatunku. Dodatkowo dostępne są ramki ograniczające nagłówek dla podziału szkoleniowego, co pozwala na wykorzystanie tego zbioru danych do prostych zadań wykrywania obiektów. W podziale testowym ramki ograniczające są puste.
Dodatkowa dokumentacja : Eksploruj w dokumentach z kodem
Strona główna : http://www.robots.ox.ac.uk/~vgg/data/pets/
Kod źródłowy :
tfds.datasets.oxford_iiit_pet.Builder
Wersje :
-
4.0.0
(domyślnie) : Dodaj ramki ograniczające nagłówek. Napraw uszkodzone obrazy. Zaktualizuj adres URL zbioru danych.
-
Rozmiar pobierania :
773.52 MiB
Rozmiar zbioru danych :
773.68 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'test' | 3669 |
'train' | 3680 |
- Struktura funkcji :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
nazwa_pliku | Tekst | smyczkowy | ||
head_bbox | Funkcja BBox | (4,) | pływak32 | |
obraz | Obraz | (Brak, Brak, 3) | uint8 | |
etykieta | Etykieta klasy | int64 | ||
maska_segmentacji | Obraz | (Brak, Brak, 1) | uint8 | |
gatunek | Etykieta klasy | int64 |
Klucze nadzorowane (zobacz dokument
as_supervised
):('image', 'label')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ): Brak.
Cytat :
@InProceedings{parkhi12a,
author = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
title = "Cats and Dogs",
booktitle = "IEEE Conference on Computer Vision and Pattern Recognition",
year = "2012",
}