- opis :
Zbiór danych Places został zaprojektowany zgodnie z zasadami wizualnego poznania człowieka. Naszym celem jest zbudowanie rdzenia wiedzy wizualnej, który można wykorzystać do szkolenia sztucznych systemów w celu wykonywania zadań związanych ze zrozumieniem wizualnym wysokiego poziomu, takich jak kontekst sceny, rozpoznawanie obiektów, przewidywanie działań i zdarzeń oraz wnioskowanie z teorii umysłu.
Semantyczne kategorie miejsc są definiowane przez ich funkcję: etykiety reprezentują podstawowy poziom środowiska. Aby to zilustrować, zbiór danych ma różne kategorie sypialni, ulic itp., ponieważ nie zachowuje się w ten sam sposób i nie przewiduje tych samych przewidywań tego, co może się wydarzyć w sypialni domowej, sypialni hotelowej lub pokoju dziecinnym. W sumie Miejsca zawierają ponad 10 milionów obrazów obejmujących ponad 400 unikalnych kategorii scen. Zbiór danych zawiera od 5000 do 30 000 obrazów treningowych na klasę, zgodnie z rzeczywistą częstotliwością występowania. Korzystając z konwolucyjnych sieci neuronowych (CNN), zestaw danych Places umożliwia uczenie się głębokich funkcji scen dla różnych zadań związanych z rozpoznawaniem scen, w celu ustanowienia nowych, najnowocześniejszych wydajności w testach porównawczych skoncentrowanych na scenach.
Tutaj udostępniamy bazę danych miejsc i przeszkolonych CNN do celów badań akademickich i edukacji.
Strona główna : http://places2.csail.mit.edu/
Kod źródłowy :
tfds.datasets.placesfull.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
143.56 GiB
Rozmiar zestawu danych :
136.56 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 10 653 087 |
- Struktura funkcji :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(256, 256, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
Nazwa pliku | Tekst | strunowy | ||
obraz | Obraz | (256, 256, 3) | uint8 | |
etykieta | Etykieta klasy | int64 |
Nadzorowane klucze (patrz
as_supervised
doc ):('image', 'label', 'filename')
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@article{zhou2017places,
title={Places: A 10 million Image Database for Scene Recognition},
author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2017},
publisher={IEEE}
}