- Descrizione :
Open Images è una versione collaborativa di circa 9 milioni di immagini annotate con etichette a livello di immagine, riquadri di delimitazione degli oggetti, maschere di segmentazione degli oggetti e relazioni visive. Questo set di dati unico, ampio e diversificato, è progettato per stimolare i progressi più avanzati nell'analisi e nella comprensione delle immagini.
Questo contiene i dati del percorso Rilevamento oggetti della competizione. L'obiettivo di questo percorso è prevedere uno stretto riquadro di delimitazione attorno a tutte le istanze di oggetti di 500 classi.
Le immagini sono annotate con etichette positive a livello di immagine, che indicano che determinate classi di oggetti sono presenti, e con etichette negative a livello di immagine, che indicano che determinate classi sono assenti. Nel concorso, tutte le altre classi senza annotazioni sono escluse dalla valutazione in quell'immagine. Per ogni etichetta positiva a livello di immagine in un'immagine, è stata annotata ogni istanza di quella classe di oggetto nell'immagine.
Pagina iniziale : https://storage.googleapis.com/openimages/web/challenge2019.html
Codice sorgente :
tfds.datasets.open_images_challenge2019_detection.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione download :
534.63 GiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'test' | 99.999 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Struttura delle caratteristiche :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_group_of': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
}),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'confidence': float32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
'source': Text(shape=(), dtype=string),
}),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
oggetti | Sequenza | |||
booggetti/bbox | Funzione BBox | (4,) | float32 | |
bobjects/is_group_of | Tensore | bool | ||
oggetti/etichetta | ClassLabel | int64 | ||
id | Testo | corda | ||
Immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
oggetti | Sequenza | |||
oggetti/fiducia | Tensore | float32 | ||
oggetti/etichetta | ClassLabel | int64 | ||
oggetti/fonte | Testo | corda |
Chiavi supervisionate (vedi il documento
as_supervised
):None
Citazione :
open_images_challenge2019_detection/200k (configurazione predefinita)
Descrizione della configurazione : le immagini hanno un massimo di 200.000 pixel, con qualità JPEG 72.
Dimensione del set di dati :
59.06 GiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
open_images_challenge2019_detection/300k
Descrizione della configurazione : le immagini hanno al massimo 300.000 pixel, con qualità JPEG 72.
Dimensione del set di dati :
80.10 GiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):