- Descrição :
Open Images é um lançamento colaborativo de aproximadamente 9 milhões de imagens anotadas com rótulos em nível de imagem, caixas delimitadoras de objetos, máscaras de segmentação de objetos e relacionamentos visuais. Este conjunto de dados excepcionalmente grande e diversificado foi projetado para estimular avanços de última geração na análise e compreensão de imagens.
Contém os dados da pista de detecção de objetos da competição. O objetivo nesta trilha é prever uma caixa delimitadora estreita em torno de todas as instâncias de objetos de 500 classes.
As imagens são anotadas com rótulos positivos no nível da imagem, indicando que certas classes de objetos estão presentes, e com rótulos negativos no nível da imagem, indicando que certas classes estão ausentes. No concurso, todas as outras turmas não anotadas ficam excluídas da avaliação nessa imagem. Para cada rótulo positivo no nível da imagem em uma imagem, cada instância dessa classe de objeto na imagem foi anotada.
Página inicial : https://storage.googleapis.com/openimages/web/challenge2019.html
Código fonte :
tfds.datasets.open_images_challenge2019_detection.Builder
Versões :
-
1.0.0
(padrão): Sem notas de versão.
-
Tamanho do download :
534.63 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 99.999 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Estrutura de recursos :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_group_of': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
}),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'confidence': float32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
'source': Text(shape=(), dtype=string),
}),
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
objetos | Seqüência | |||
bobjects/bbox | BBoxFeature | (4,) | float32 | |
bobjects/is_group_of | Tensor | bool | ||
objetos/etiqueta | ClassLabel | int64 | ||
eu ia | Texto | corda | ||
imagem | Imagem | (Nenhum, Nenhum, 3) | uint8 | |
objetos | Seqüência | |||
objetos/confiança | Tensor | float32 | ||
objetos/rótulo | ClassLabel | int64 | ||
objetos/fonte | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):None
Citação :
open_images_challenge2019_detection/200k (configuração padrão)
Descrição da configuração : As imagens têm no máximo 200.000 pixels, com qualidade 72 JPEG.
Tamanho do conjunto de dados :
59.06 GiB
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
open_images_challenge2019_detection/300k
Descrição da configuração : As imagens têm no máximo 300.000 pixels, com qualidade 72 JPEG.
Tamanho do conjunto de dados :
80.10 GiB
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):