Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

open_images_challenge2019_detection

Visualização : Explorar em Conheça seus dados
Descrição :

O Open Images é uma versão colaborativa de aproximadamente 9 milhões de imagens anotadas com rótulos no nível da imagem, caixas delimitadoras de objetos, máscaras de segmentação de objetos e relacionamentos visuais. Este conjunto de dados excepcionalmente grande e diversificado foi projetado para estimular avanços de última geração na análise e compreensão de imagens.

Este contém os dados da trilha de Detecção de Objetos da competição. O objetivo nesta faixa é prever uma caixa delimitadora compacta em torno de todas as instâncias de objeto de 500 classes.

As imagens são anotadas com rótulos positivos em nível de imagem, indicando que certas classes de objetos estão presentes, e com rótulos negativos em nível de imagem, indicando que certas classes estão ausentes. Na competição, todas as outras classes não anotadas são excluídas da avaliação nessa imagem. Para cada rótulo de nível de imagem positivo em uma imagem, cada instância dessa classe de objeto na imagem foi anotada.

Página inicial : https://storage.googleapis.com/openimages/web/challenge2019.html
Código -fonte: tfds.datasets.open_images_challenge2019_detection.Builder
Versões :
- 1.0.0 (padrão): sem notas de versão.
Tamanho do download : 534.63 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :

Dividir	Exemplos
`'test'`	99.999
`'train'`	1.743.042
`'validation'`	41.620

Estrutura de recursos :

FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})

Documentação do recurso:

Característica	Classe	Forma	Tipo D
	RecursosDict
bobjects	Seqüência
bobjects/bbox	Recurso BBox	(4,)	float32
bobjects/is_group_of	tensor		bool
bobjects/label	ClassLabel		int64
Eu iria	Texto		corda
imagem	Imagem	(Nenhuma, Nenhuma, 3)	uint8
objetos	Seqüência
objetos/confiança	tensor		float32
objetos/rótulo	ClassLabel		int64
objetos/fonte	Texto		corda

Chaves supervisionadas (Consulte as_supervised doc ): None
Citação :

open_images_challenge2019_detection/200k (configuração padrão)

Descrição da configuração : As imagens têm no máximo 200.000 pixels, com qualidade 72 JPEG.
Tamanho do conjunto de dados : 59.06 GiB
Figura ( tfds.show_examples ):

Visualização

Exemplos ( tfds.as_dataframe ):

open_images_challenge2019_detection/300k

Descrição da configuração : As imagens têm no máximo 300.000 pixels, com qualidade 72 JPEG.
Tamanho do conjunto de dados : 80.10 GiB
Figura ( tfds.show_examples ):

Visualização

Exemplos ( tfds.as_dataframe ):