open_images_challenge2019_detection

  • Descrizione :

Open Images è una versione collaborativa di circa 9 milioni di immagini annotate con etichette a livello di immagine, riquadri di delimitazione degli oggetti, maschere di segmentazione degli oggetti e relazioni visive. Questo set di dati unico, ampio e diversificato, è progettato per stimolare i progressi più avanzati nell'analisi e nella comprensione delle immagini.

Questo contiene i dati del percorso Rilevamento oggetti della competizione. L'obiettivo di questo percorso è prevedere uno stretto riquadro di delimitazione attorno a tutte le istanze di oggetti di 500 classi.

Le immagini sono annotate con etichette positive a livello di immagine, che indicano che determinate classi di oggetti sono presenti, e con etichette negative a livello di immagine, che indicano che determinate classi sono assenti. Nel concorso, tutte le altre classi senza annotazioni sono escluse dalla valutazione in quell'immagine. Per ogni etichetta positiva a livello di immagine in un'immagine, è stata annotata ogni istanza di quella classe di oggetto nell'immagine.

Diviso Esempi
'test' 99.999
'train' 1.743.042
'validation' 41.620
  • Struttura delle caratteristiche :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
oggetti Sequenza
booggetti/bbox Funzione BBox (4,) float32
bobjects/is_group_of Tensore bool
oggetti/etichetta ClassLabel int64
id Testo corda
Immagine Immagine (Nessuno, Nessuno, 3) uint8
oggetti Sequenza
oggetti/fiducia Tensore float32
oggetti/etichetta ClassLabel int64
oggetti/fonte Testo corda

open_images_challenge2019_detection/200k (configurazione predefinita)

  • Descrizione della configurazione : le immagini hanno un massimo di 200.000 pixel, con qualità JPEG 72.

  • Dimensione del set di dati : 59.06 GiB

  • Figura ( tfds.show_examples ):

Visualizzazione

open_images_challenge2019_detection/300k

  • Descrizione della configurazione : le immagini hanno al massimo 300.000 pixel, con qualità JPEG 72.

  • Dimensione del set di dati : 80.10 GiB

  • Figura ( tfds.show_examples ):

Visualizzazione