aflw2k3d

  • Mô tả :

AFLW2000-3D là tập dữ liệu gồm 2000 hình ảnh đã được chú thích bằng các mốc trên khuôn mặt 68 điểm ở cấp độ hình ảnh. Bộ dữ liệu này thường được sử dụng để đánh giá các mô hình phát hiện mốc khuôn mặt 3D. Các tư thế đầu rất đa dạng và thường khó bị phát hiện bởi máy dò khuôn mặt dựa trên cnn. Các mốc 2D bị bỏ qua trong bộ dữ liệu này, vì một số dữ liệu không nhất quán với 21 điểm, như bài báo gốc đã đề cập.

Tách ra ví dụ
'train' 2.000
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(450, 450, 3), dtype=uint8),
    'landmarks_68_3d_xy_normalized': Tensor(shape=(68, 2), dtype=float32),
    'landmarks_68_3d_z': Tensor(shape=(68, 1), dtype=float32),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (450, 450, 3) uint8
mốc_68_3d_xy_chuẩn hóa tenxơ (68, 2) phao32
địa danh_68_3d_z tenxơ (68, 1) phao32

Hình dung

  • trích dẫn :
@article{DBLP:journals/corr/ZhuLLSL15,
  author    = {Xiangyu Zhu and
               Zhen Lei and
               Xiaoming Liu and
               Hailin Shi and
               Stan Z. Li},
  title     = {Face Alignment Across Large Poses: {A} 3D Solution},
  journal   = {CoRR},
  volume    = {abs/1511.07212},
  year      = {2015},
  url       = {http://arxiv.org/abs/1511.07212},
  archivePrefix = {arXiv},
  eprint    = {1511.07212},
  timestamp = {Mon, 13 Aug 2018 16:48:23 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/ZhuLLSL15},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}