crema_d

  • الوصف :

CREMA-D عبارة عن مجموعة بيانات صوتية ومرئية للتعرف على المشاعر. تتكون مجموعة البيانات من تعبيرات عاطفية وجهية وصوتية في جمل منطوقة في مجموعة من الحالات العاطفية الأساسية (السعادة والحزن والغضب والخوف والاشمئزاز والحيادية). تم جمع 7442 مقطعًا من 91 ممثلًا من خلفيات عرقية متنوعة. يحتوي هذا الإصدار فقط على دفق الصوت من التسجيل الصوتي والمرئي الأصلي. يتم تقسيم العينات بين القطار والتحقق من الصحة والاختبار بحيث تنتمي العينات من كل متحدث إلى تقسيم واحد بالضبط.

انشق، مزق أمثلة
'test' 1،556
'train' 5،144
'validation' 738
  • هيكل الميزة :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صوتي صوتي (لا أحد،) int64
ضع الكلمة المناسبة ClassLabel int64
Speaker_id موتر سلسلة
  • الاقتباس :
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}