open_images_challenge2019_detection

O Open Images é uma versão colaborativa de aproximadamente 9 milhões de imagens anotadas com rótulos no nível da imagem, caixas delimitadoras de objetos, máscaras de segmentação de objetos e relacionamentos visuais. Este conjunto de dados excepcionalmente grande e diversificado foi projetado para estimular avanços de última geração na análise e compreensão de imagens.

Este contém os dados da trilha de Detecção de Objetos da competição. O objetivo nesta faixa é prever uma caixa delimitadora compacta em torno de todas as instâncias de objeto de 500 classes.

As imagens são anotadas com rótulos positivos em nível de imagem, indicando que certas classes de objetos estão presentes, e com rótulos negativos em nível de imagem, indicando que certas classes estão ausentes. Na competição, todas as outras classes não anotadas são excluídas da avaliação nessa imagem. Para cada rótulo de nível de imagem positivo em uma imagem, cada instância dessa classe de objeto na imagem foi anotada.

Dividir Exemplos
'test' 99.999
'train' 1.743.042
'validation' 41.620
  • Estrutura de recursos :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
bobjects Seqüência
bobjects/bbox Recurso BBox (4,) float32
bobjects/is_group_of tensor bool
bobjects/label ClassLabel int64
Eu iria Texto corda
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
objetos Seqüência
objetos/confiança tensor float32
objetos/rótulo ClassLabel int64
objetos/fonte Texto corda

open_images_challenge2019_detection/200k (configuração padrão)

  • Descrição da configuração : As imagens têm no máximo 200.000 pixels, com qualidade 72 JPEG.

  • Tamanho do conjunto de dados : 59.06 GiB

  • Figura ( tfds.show_examples ):

Visualização

open_images_challenge2019_detection/300k

  • Descrição da configuração : As imagens têm no máximo 300.000 pixels, com qualidade 72 JPEG.

  • Tamanho do conjunto de dados : 80.10 GiB

  • Figura ( tfds.show_examples ):

Visualização