open_images_challenge2019_detection

  • Descrição :

Open Images é um lançamento colaborativo de aproximadamente 9 milhões de imagens anotadas com rótulos em nível de imagem, caixas delimitadoras de objetos, máscaras de segmentação de objetos e relacionamentos visuais. Este conjunto de dados excepcionalmente grande e diversificado foi projetado para estimular avanços de última geração na análise e compreensão de imagens.

Contém os dados da pista de detecção de objetos da competição. O objetivo nesta trilha é prever uma caixa delimitadora estreita em torno de todas as instâncias de objetos de 500 classes.

As imagens são anotadas com rótulos positivos no nível da imagem, indicando que certas classes de objetos estão presentes, e com rótulos negativos no nível da imagem, indicando que certas classes estão ausentes. No concurso, todas as outras turmas não anotadas ficam excluídas da avaliação nessa imagem. Para cada rótulo positivo no nível da imagem em uma imagem, cada instância dessa classe de objeto na imagem foi anotada.

Dividir Exemplos
'test' 99.999
'train' 1.743.042
'validation' 41.620
  • Estrutura de recursos :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
objetos Seqüência
bobjects/bbox BBoxFeature (4,) float32
bobjects/is_group_of Tensor bool
objetos/etiqueta ClassLabel int64
eu ia Texto corda
imagem Imagem (Nenhum, Nenhum, 3) uint8
objetos Seqüência
objetos/confiança Tensor float32
objetos/rótulo ClassLabel int64
objetos/fonte Texto corda

open_images_challenge2019_detection/200k (configuração padrão)

  • Descrição da configuração : As imagens têm no máximo 200.000 pixels, com qualidade 72 JPEG.

  • Tamanho do conjunto de dados : 59.06 GiB

  • Figura ( tfds.show_examples ):

Visualização

open_images_challenge2019_detection/300k

  • Descrição da configuração : As imagens têm no máximo 300.000 pixels, com qualidade 72 JPEG.

  • Tamanho do conjunto de dados : 80.10 GiB

  • Figura ( tfds.show_examples ):

Visualização