สะบัด

  • คำอธิบาย :

จากรายงาน: เรารวบรวมชุดข้อมูลรูปภาพ 5003 โดยอัตโนมัติจากภาพยนตร์ฮอลลีวูดยอดนิยม ภาพได้มาจากการใช้เครื่องตรวจจับบุคคลที่ล้ำสมัยในทุก ๆ เฟรมที่สิบของภาพยนตร์ 30 เรื่อง จากนั้นผู้คนที่ตรวจพบด้วยความมั่นใจสูง (ผู้สมัครประมาณ 20,000 คน) จะถูกส่งไปยังตลาดการระดมทุนแบบมวลชนของ Amazon Mechanical Turk เพื่อรับการติดฉลากความจริง แต่ละภาพมีคำอธิบายประกอบโดยชาวเติร์ก 5 คน ในราคา 0.01 ดอลลาร์ต่อภาพ เพื่อติดป้ายกำกับข้อต่อบนร่างกาย 10 ข้อ การติดป้ายกำกับค่ามัธยฐานจากห้าค่าถูกถ่ายในแต่ละภาพเพื่อให้ทนทานต่อคำอธิบายประกอบที่ผิดปกติ สุดท้าย เราปฏิเสธรูปภาพด้วยตนเองหากบุคคลนั้นถูกบังหรือไม่มีหน้าผากอย่างรุนแรง เราจัดสรรข้อมูลไว้ 20% (1,016 ภาพ) สำหรับการทดสอบ

แยก ตัวอย่าง
'test' 1,016
'train' 3,987
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
เคอร์เซอร์เฟรม เทนเซอร์ ลอย64
ภาพ ภาพ (480, 720, 3) uint8
ชื่อภาพยนตร์ ข้อความ เชือก
poselet_hit_idx ลำดับ (เทนเซอร์) (ไม่มี,) uint16
กล่องลำตัว คุณสมบัติ BBox (4,) ลอย32
xcoords ลำดับ (เทนเซอร์) (ไม่มี,) ลอย64
ycoords ลำดับ (เทนเซอร์) (ไม่มี,) ลอย64
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • การอ้างอิง :

@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : ใช้ตัวอย่าง 5003 ตัวอย่างที่ใช้ในกระดาษ CVPR13 MODEC

  • ขนาดดาวน์โหลด : 286.35 MiB

  • รูป ( tfds.show_examples ):

การแสดงภาพ

สะบัด/เต็ม

  • คำอธิบายการกำหนดค่า : ใช้ตัวอย่าง 20928 ชุดซึ่งเป็นชุดย่อยของ FLIC ที่ประกอบด้วยตัวอย่างที่ยากกว่า

  • ขนาดการดาวน์โหลด : 1.10 GiB

  • รูป ( tfds.show_examples ):

การแสดงภาพ