- الوصف :
CREMA-D عبارة عن مجموعة بيانات صوتية ومرئية للتعرف على المشاعر. تتكون مجموعة البيانات من تعبيرات عاطفية وجهية وصوتية في جمل منطوقة في مجموعة من الحالات العاطفية الأساسية (السعادة والحزن والغضب والخوف والاشمئزاز والحيادية). تم جمع 7442 مقطعًا من 91 ممثلًا من خلفيات عرقية متنوعة. يحتوي هذا الإصدار فقط على دفق الصوت من التسجيل الصوتي والمرئي الأصلي. يتم تقسيم العينات بين القطار والتحقق من الصحة والاختبار بحيث تنتمي العينات من كل متحدث إلى تقسيم واحد بالضبط.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/CheyneyComputerScience/CREMA-D
كود المصدر :
tfds.audio.CremaD
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
579.25 MiB
حجم مجموعة البيانات :
1.65 GiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 1،556 |
'train' | 5،144 |
'validation' | 738 |
- هيكل الميزة :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
صوتي | صوتي | (لا أحد،) | int64 | |
ضع الكلمة المناسبة | ClassLabel | int64 | ||
Speaker_id | موتر | سلسلة |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('audio', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@article{cao2014crema,
title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
journal={IEEE transactions on affective computing},
volume={5},
number={4},
pages={377--390},
year={2014},
publisher={IEEE}
}