- Descrizione :
Questo set di dati contiene i dati della PASCAL Visual Object Classes Challenge, corrispondente alle competizioni Classification and Detection.
Nella competizione Classificazione, l'obiettivo è prevedere l'insieme di etichette contenute nell'immagine, mentre nella competizione Rilevamento l'obiettivo è prevedere il riquadro di delimitazione e l'etichetta di ogni singolo oggetto. ATTENZIONE: Come per il dataset ufficiale, il test set di VOC2012 non contiene annotazioni.
Documentazione aggiuntiva : Esplora documenti con codice
Codice sorgente :
tfds.object_detection.Voc
Versioni :
-
4.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Cache automatica ( documentazione ): No
Struttura delle caratteristiche :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
immagine/nome file | Testo | corda | ||
etichette | Sequenza(EtichettaClasse) | (Nessuno,) | int64 | |
etichette_no_difficile | Sequenza(EtichettaClasse) | (Nessuno,) | int64 | |
oggetti | Sequenza | |||
oggetti/box | Funzionalità BBox | (4,) | galleggiante32 | |
oggetti/è_difficile | Tensore | bool | ||
oggetti/è_troncato | Tensore | bool | ||
oggetti/etichetta | ClassLabel | int64 | ||
oggetti/posa | ClassLabel | int64 |
- Chiavi supervisionate (Vedi
as_supervised
doc ):None
voc/2007 (configurazione predefinita)
- Descrizione della configurazione : questo set di dati contiene i dati del PASCAL Visual Object Classes Challenge 2007, noto anche come VOC2007.
Un totale di 9963 immagini sono incluse in questo set di dati, in cui ogni immagine contiene un insieme di oggetti, su 20 classi diverse, per un totale di 24640 oggetti annotati.
Dimensioni del download :
868.85 MiB
Dimensione del set di dati:
837.73 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 4.952 |
'train' | 2.501 |
'validation' | 2.510 |
- Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
- Citazione :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
voc/2012
- Descrizione della configurazione : questo set di dati contiene i dati del PASCAL Visual Object Classes Challenge 2012, noto anche come VOC2012.
In questo set di dati è incluso un totale di 11540 immagini, in cui ogni immagine contiene un insieme di oggetti, su 20 classi diverse, per un totale di 27450 oggetti annotati.
Pagina iniziale : http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
Dimensione del download :
3.59 GiB
Dimensione del set di dati:
2.44 GiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 10.991 |
'train' | 5.717 |
'validation' | 5.823 |
- Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
- Citazione :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}