open_images_challenge2019_detection

Descrizione :

Open Images è una versione collaborativa di circa 9 milioni di immagini annotate con etichette a livello di immagine, riquadri di delimitazione degli oggetti, maschere di segmentazione degli oggetti e relazioni visive. Questo set di dati unico, ampio e diversificato, è progettato per stimolare i progressi più avanzati nell'analisi e nella comprensione delle immagini.

Questo contiene i dati del percorso Rilevamento oggetti della competizione. L'obiettivo di questo percorso è prevedere uno stretto riquadro di delimitazione attorno a tutte le istanze di oggetti di 500 classi.

Le immagini sono annotate con etichette positive a livello di immagine, che indicano che determinate classi di oggetti sono presenti, e con etichette negative a livello di immagine, che indicano che determinate classi sono assenti. Nel concorso, tutte le altre classi senza annotazioni sono escluse dalla valutazione in quell'immagine. Per ogni etichetta positiva a livello di immagine in un'immagine, è stata annotata ogni istanza di quella classe di oggetto nell'immagine.

Pagina iniziale : https://storage.googleapis.com/openimages/web/challenge2019.html
Codice sorgente : tfds.datasets.open_images_challenge2019_detection.Builder
Versioni :
- 1.0.0 (impostazione predefinita): nessuna nota di rilascio.
Dimensione download : 534.63 GiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :

Diviso	Esempi
`'test'`	99.999
`'train'`	1.743.042
`'validation'`	41.620

Struttura delle caratteristiche :

FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Forma	Tipo D
	CaratteristicheDict
oggetti	Sequenza
booggetti/bbox	Funzione BBox	(4,)	float32
bobjects/is_group_of	Tensore		bool
oggetti/etichetta	ClassLabel		int64
id	Testo		corda
Immagine	Immagine	(Nessuno, Nessuno, 3)	uint8
oggetti	Sequenza
oggetti/fiducia	Tensore		float32
oggetti/etichetta	ClassLabel		int64
oggetti/fonte	Testo		corda

Chiavi supervisionate (vedi il documento as_supervised ): None
Citazione :

open_images_challenge2019_detection/200k (configurazione predefinita)

Descrizione della configurazione : le immagini hanno un massimo di 200.000 pixel, con qualità JPEG 72.
Dimensione del set di dati : 59.06 GiB
Figura ( tfds.show_examples ):

Visualizzazione

Esempi ( tfds.as_dataframe ):

open_images_challenge2019_detection/300k

Descrizione della configurazione : le immagini hanno al massimo 300.000 pixel, con qualità JPEG 72.
Dimensione del set di dati : 80.10 GiB
Figura ( tfds.show_examples ):

Visualizzazione

Esempi ( tfds.as_dataframe ):