miejsca pełne

  • opis :

Zbiór danych Places został zaprojektowany zgodnie z zasadami wizualnego poznania człowieka. Naszym celem jest zbudowanie rdzenia wiedzy wizualnej, który można wykorzystać do szkolenia sztucznych systemów w celu wykonywania zadań związanych ze zrozumieniem wizualnym wysokiego poziomu, takich jak kontekst sceny, rozpoznawanie obiektów, przewidywanie działań i zdarzeń oraz wnioskowanie z teorii umysłu.

Semantyczne kategorie miejsc są definiowane przez ich funkcję: etykiety reprezentują podstawowy poziom środowiska. Aby to zilustrować, zbiór danych ma różne kategorie sypialni, ulic itp., ponieważ nie zachowuje się w ten sam sposób i nie przewiduje tych samych przewidywań tego, co może się wydarzyć w sypialni domowej, sypialni hotelowej lub pokoju dziecinnym. W sumie Miejsca zawierają ponad 10 milionów obrazów obejmujących ponad 400 unikalnych kategorii scen. Zbiór danych zawiera od 5000 do 30 000 obrazów treningowych na klasę, zgodnie z rzeczywistą częstotliwością występowania. Korzystając z konwolucyjnych sieci neuronowych (CNN), zestaw danych Places umożliwia uczenie się głębokich funkcji scen dla różnych zadań związanych z rozpoznawaniem scen, w celu ustanowienia nowych, najnowocześniejszych wydajności w testach porównawczych skoncentrowanych na scenach.

Tutaj udostępniamy bazę danych miejsc i przeszkolonych CNN do celów badań akademickich i edukacji.

Rozdzielać Przykłady
'train' 10 653 087
  • Struktura funkcji :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
Nazwa pliku Tekst strunowy
obraz Obraz (256, 256, 3) uint8
etykieta Etykieta klasy int64

Wyobrażanie sobie

  • Cytat :
@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}