- Açıklama :
CREMA-D, duygu tanıma için görsel-işitsel bir veri setidir. Veri seti, bir dizi temel duygusal durumda (mutlu, üzgün, kızgın, korku, tiksinti ve tarafsız) konuşulan cümlelerdeki yüz ve sesli duygusal ifadelerden oluşur. Farklı etnik kökenlere sahip 91 aktörün 7.442 klibi toplandı. Bu sürüm, yalnızca orijinal görsel-işitsel kayıttan gelen ses akışını içerir. Numuneler, her bir konuşmacıdan alınan numunelerin tam olarak bir ayrıma ait olması için tren, doğrulama ve test arasında bölünmüştür.
Ana Sayfa : https://github.com/CheyneyComputerScience/CREMA-D
Kaynak kodu :
tfds.audio.CremaD
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
579.25 MiB
Veri kümesi boyutu :
1.65 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.556 |
'train' | 5.144 |
'validation' | 738 |
- Özellik yapısı :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
ses | Ses | (Hiçbiri,) | int64 | |
etiket | SınıfEtiketi | int64 | ||
hoparlör_kimliği | tensör | sicim |
Denetlenen tuşlar (Bkz
as_supervised
doc ):('audio', 'label')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@article{cao2014crema,
title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
journal={IEEE transactions on affective computing},
volume={5},
number={4},
pages={377--390},
year={2014},
publisher={IEEE}
}