Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

gatinho

Visualização : Explorar em Conheça seus dados
Descrição :

Kitti contém um conjunto de tarefas de visão construídas usando uma plataforma de direção autônoma. O benchmark completo contém muitas tarefas, como estéreo, fluxo óptico, odometria visual, etc. Este conjunto de dados contém o conjunto de dados de detecção de objetos, incluindo as imagens monoculares e caixas delimitadoras. O conjunto de dados contém 7.481 imagens de treinamento anotadas com caixas delimitadoras 3D. Uma descrição completa das anotações pode ser encontrada no leia-me do kit de desenvolvimento de objetos na página inicial do Kitti.

Documentação Adicional : Explore em Papers With Code
Página inicial : http://www.cvlibs.net/datasets/kitti/
Código-fonte : tfds.datasets.kitti.Builder
Versões :
- 3.1.0 : Sem notas de versão.
- 3.2.0 : Devkit atualizado.
- 3.3.0 (padrão): Adicionados rótulos para o recurso occluded .
Tamanho do download : 11.71 GiB
Tamanho do conjunto de dados : 5.27 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :

Dividir	Exemplos
`'test'`	711
`'train'`	6.347
`'validation'`	423

Estrutura de recursos :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})

Documentação do recurso :

Característica	Classe	Forma	Tipo D	Descrição
	RecursosDict
imagem	Imagem	(Nenhuma, Nenhuma, 3)	uint8
image/file_name	Texto		corda
objetos	Seqüência
objetos/alfa	tensor		float32	Ângulo de observação do objeto, variando [-pi..pi]
objetos/bbox	Recurso BBox	(4,)	float32	Caixa delimitadora 2D do objeto na imagem
objetos/dimensões	tensor	(3,)	float32	Dimensões do objeto 3D: altura, largura, comprimento (em metros)
objetos/localização	tensor	(3,)	float32	Localização do objeto 3D x,y,z nas coordenadas da câmera (em metros)
objetos/ocluído	ClassLabel		int64	Número inteiro (0,1,2,3) indicando o estado de oclusão: 0 = totalmente visível, 1 = parcialmente ocluído 2 = amplamente ocluído, 3 = desconhecido
objetos/rotação_y	tensor		float32	Rotação ry em torno do eixo Y nas coordenadas da câmera [-pi..pi]
objetos/truncados	tensor		float32	Flutuar de 0 (não truncado) a 1 (truncado), onde truncado refere-se ao objeto deixando os limites da imagem
objetos/tipo	ClassLabel		int64	O tipo de objeto, por exemplo, 'Car' ou 'Van'

Chaves supervisionadas (Consulte as_supervised doc ): None
Figura ( tfds.show_examples ):

Visualização

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}

gatinho Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

gatinho