crema_d

คำอธิบาย :

CREMA-D เป็นชุดข้อมูลภาพและเสียงสำหรับการจดจำอารมณ์ ชุดข้อมูลประกอบด้วยการแสดงอารมณ์ทางสีหน้าและเสียงในประโยคที่พูดในสภาวะทางอารมณ์พื้นฐานต่างๆ (มีความสุข เศร้า โกรธ กลัว รังเกียจ และเป็นกลาง) รวบรวมคลิป 7,442 คลิปของนักแสดง 91 คนที่มีภูมิหลังทางเชื้อชาติที่หลากหลาย รุ่นนี้มีเฉพาะสตรีมเสียงจากการบันทึกเสียงและภาพต้นฉบับเท่านั้น ตัวอย่างจะถูกแยกระหว่างการฝึก การตรวจสอบความถูกต้อง และการทดสอบ เพื่อให้ตัวอย่างจากลำโพงแต่ละตัวเป็นของการแยกส่วนเดียว

เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
โฮมเพจ : https://github.com/CheyneyComputerScience/CREMA-D
รหัสแหล่งที่มา : tfds.audio.CremaD
รุ่น :
- 1.0.0 (ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
ขนาดการดาวน์โหลด : 579.25 MiB
ขนาดชุดข้อมูล : 1.65 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :

แยก	ตัวอย่าง
`'test'`	1,556
`'train'`	5,144
`'validation'`	738

โครงสร้างคุณลักษณะ :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})

เอกสารคุณสมบัติ :

ลักษณะเฉพาะ	ระดับ	รูปร่าง	Dประเภท
	คุณสมบัติDict
เสียง	เครื่องเสียง	(ไม่มี,)	int64
ฉลาก	ป้ายกำกับคลาส		int64
รหัสลำโพง	เทนเซอร์		สตริง

คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('audio', 'label')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):

การอ้างอิง :

@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}

crema_d จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ

crema_d