- Sự miêu tả :
Từ bài báo: Chúng tôi đã tự động thu thập tập dữ liệu hình ảnh 5003 từ các bộ phim nổi tiếng của Hollywood. Những hình ảnh thu được bằng cách chạy máy dò người hiện đại trên mỗi khung hình thứ mười của 30 bộ phim. Sau đó, những người được phát hiện với độ tin cậy cao (khoảng 20 nghìn ứng viên) được gửi đến thị trường cung cấp dịch vụ cộng đồng Amazon Mechanical Turk để nhận được nhãn mác sự thật. Mỗi hình ảnh được chú thích bởi 5 người Turkers với giá 0,01 USD cho mỗi hình ảnh để dán nhãn cho 10 khớp trên cơ thể. Việc ghi nhãn trung bình trong số năm được thực hiện trong mỗi hình ảnh để phù hợp với chú thích ngoại lệ. Cuối cùng, chúng tôi sẽ từ chối hình ảnh theo cách thủ công nếu người đó bị che khuất hoặc không có chính diện. Chúng tôi dành 20% (1016 hình ảnh) dữ liệu để thử nghiệm.
Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : https://bensapp.github.io/flic-dataset.html
Mã nguồn :
tfds.datasets.flic.Builder
Phiên bản :
-
2.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tập dữ liệu :
317.94 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 1.016 |
'train' | 3,987 |
- Cấu trúc tính năng :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
khung hình | Tenxơ | phao64 | ||
hình ảnh | Hình ảnh | (480, 720, 3) | uint8 | |
tên bộ phim | Chữ | sợi dây | ||
poselet_hit_idx | Trình tự(Tensor) | (Không có,) | uint16 | |
hộp đựng thân xác | Tính năng BBox | (4,) | phao32 | |
xcoords | Trình tự(Tensor) | (Không có,) | phao64 | |
ycoords | Trình tự(Tensor) | (Không có,) | phao64 |
Khóa được giám sát (Xem
as_supervised
doc ):None
Trích dẫn :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (cấu hình mặc định)
Mô tả cấu hình : Sử dụng 5003 ví dụ được sử dụng trong bài viết CVPR13 MODEC.
Kích thước tải xuống :
286.35 MiB
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
phập phồng/đầy đủ
Mô tả cấu hình : Sử dụng 20928 ví dụ, siêu bộ FLIC bao gồm các ví dụ khó hơn.
Kích thước tải xuống :
1.10 GiB
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):