- Descrição :
Do artigo: Coletamos automaticamente um conjunto de dados de 5.003 imagens de filmes populares de Hollywood. As imagens foram obtidas executando um detector de pessoas de última geração em cada décimo quadro de 30 filmes. As pessoas detectadas com alta confiança (cerca de 20 mil candidatos) foram então enviadas ao mercado de crowdsourcing Amazon Mechanical Turk para obter a rotulagem da verdade. Cada imagem foi anotada por cinco Turkers por US$ 0,01 cada para rotular 10 articulações da parte superior do corpo. A rotulagem mediana de cinco foi obtida em cada imagem para ser robusta à anotação de valores discrepantes. Finalmente, as imagens foram rejeitadas manualmente por nós se a pessoa estivesse ocluída ou severamente não frontal. Reservamos 20% (1.016 imagens) dos dados para teste.
Documentação adicional : Explore artigos com código
Página inicial : https://bensapp.github.io/flic-dataset.html
Código fonte :
tfds.datasets.flic.Builder
Versões :
-
2.0.0
(padrão): Sem notas de versão.
-
Tamanho do conjunto de dados :
317.94 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 1.016 |
'train' | 3.987 |
- Estrutura de recursos :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
currframe | Tensor | float64 | ||
imagem | Imagem | (480, 720, 3) | uint8 | |
nome do filme | Texto | corda | ||
poselet_hit_idx | Sequência (Tensor) | (Nenhum,) | uint16 | |
caixa de torso | BBoxFeature | (4,) | float32 | |
xcoords | Sequência (Tensor) | (Nenhum,) | float64 | |
coordenadas | Sequência (Tensor) | (Nenhum,) | float64 |
Chaves supervisionadas (consulte o documento
as_supervised
):None
Citação :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (configuração padrão)
Descrição da configuração : usa 5003 exemplos usados no artigo CVPR13 MODEC.
Tamanho do download :
286.35 MiB
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
filme/completo
Descrição da configuração : usa 20.928 exemplos, um superconjunto do FLIC que consiste em exemplos mais difíceis.
Tamanho do download :
1.10 GiB
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):