krema_d

  • Açıklama :

CREMA-D, duygu tanıma için görsel-işitsel bir veri setidir. Veri seti, bir dizi temel duygusal durumda (mutlu, üzgün, kızgın, korku, tiksinti ve tarafsız) konuşulan cümlelerdeki yüz ve sesli duygusal ifadelerden oluşur. Farklı etnik kökenlere sahip 91 aktörün 7.442 klibi toplandı. Bu sürüm, yalnızca orijinal görsel-işitsel kayıttan gelen ses akışını içerir. Numuneler, her bir konuşmacıdan alınan numunelerin tam olarak bir ayrıma ait olması için tren, doğrulama ve test arasında bölünmüştür.

Bölmek örnekler
'test' 1.556
'train' 5.144
'validation' 738
  • Özellik yapısı :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
ses Ses (Hiçbiri,) int64
etiket SınıfEtiketi int64
hoparlör_kimliği tensör sicim
  • Alıntı :
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}