crema_d

  • คำอธิบาย :

CREMA-D เป็นชุดข้อมูลภาพและเสียงสำหรับการจดจำอารมณ์ ชุดข้อมูลประกอบด้วยการแสดงอารมณ์ทางสีหน้าและเสียงในประโยคที่พูดในสภาวะทางอารมณ์พื้นฐานต่างๆ (มีความสุข เศร้า โกรธ กลัว รังเกียจ และเป็นกลาง) รวบรวมคลิป 7,442 คลิปของนักแสดง 91 คนที่มีภูมิหลังทางเชื้อชาติที่หลากหลาย รุ่นนี้มีเฉพาะสตรีมเสียงจากการบันทึกเสียงและภาพต้นฉบับเท่านั้น ตัวอย่างจะถูกแยกระหว่างการฝึก การตรวจสอบความถูกต้อง และการทดสอบ เพื่อให้ตัวอย่างจากลำโพงแต่ละตัวเป็นของการแยกส่วนเดียว

แยก ตัวอย่าง
'test' 1,556
'train' 5,144
'validation' 738
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
เสียง เครื่องเสียง (ไม่มี,) int64
ฉลาก ป้ายกำกับคลาส int64
รหัสลำโพง เทนเซอร์ สตริง
  • การอ้างอิง :
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}