filme

  • Descrição :

Do artigo: Coletamos automaticamente um conjunto de dados de 5.003 imagens de filmes populares de Hollywood. As imagens foram obtidas executando um detector de pessoas de última geração em cada décimo quadro de 30 filmes. As pessoas detectadas com alta confiança (cerca de 20 mil candidatos) foram então enviadas ao mercado de crowdsourcing Amazon Mechanical Turk para obter a rotulagem da verdade. Cada imagem foi anotada por cinco Turkers por US$ 0,01 cada para rotular 10 articulações da parte superior do corpo. A rotulagem mediana de cinco foi obtida em cada imagem para ser robusta à anotação de valores discrepantes. Finalmente, as imagens foram rejeitadas manualmente por nós se a pessoa estivesse ocluída ou severamente não frontal. Reservamos 20% (1.016 imagens) dos dados para teste.

Dividir Exemplos
'test' 1.016
'train' 3.987
  • Estrutura de recursos :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
currframe Tensor float64
imagem Imagem (480, 720, 3) uint8
nome do filme Texto corda
poselet_hit_idx Sequência (Tensor) (Nenhum,) uint16
caixa de torso BBoxFeature (4,) float32
xcoords Sequência (Tensor) (Nenhum,) float64
coordenadas Sequência (Tensor) (Nenhum,) float64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (configuração padrão)

  • Descrição da configuração : usa 5003 exemplos usados ​​no artigo CVPR13 MODEC.

  • Tamanho do download : 286.35 MiB

  • Figura ( tfds.show_examples ):

Visualização

filme/completo

  • Descrição da configuração : usa 20.928 exemplos, um superconjunto do FLIC que consiste em exemplos mais difíceis.

  • Tamanho do download : 1.10 GiB

  • Figura ( tfds.show_examples ):

Visualização