crema_d

الوصف :

CREMA-D عبارة عن مجموعة بيانات صوتية ومرئية للتعرف على المشاعر. تتكون مجموعة البيانات من تعبيرات عاطفية وجهية وصوتية في جمل منطوقة في مجموعة من الحالات العاطفية الأساسية (السعادة والحزن والغضب والخوف والاشمئزاز والحيادية). تم جمع 7442 مقطعًا من 91 ممثلًا من خلفيات عرقية متنوعة. يحتوي هذا الإصدار فقط على دفق الصوت من التسجيل الصوتي والمرئي الأصلي. يتم تقسيم العينات بين القطار والتحقق من الصحة والاختبار بحيث تنتمي العينات من كل متحدث إلى تقسيم واحد بالضبط.

وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/CheyneyComputerScience/CREMA-D
كود المصدر : tfds.audio.CremaD
إصدارات :
- 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
حجم التحميل : 579.25 MiB
حجم مجموعة البيانات : 1.65 GiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :

انشق، مزق	أمثلة
`'test'`	1،556
`'train'`	5،144
`'validation'`	738

هيكل الميزة :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})

وثائق الميزة :

ميزة	فصل	شكل	نوع
	الميزات
صوتي	صوتي	(لا أحد،)	int64
ضع الكلمة المناسبة	ClassLabel		int64
Speaker_id	موتر		سلسلة

المفاتيح الخاضعة للإشراف (راجع المستند as_supervised ): ('audio', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):

الاقتباس :

@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}

crema_d تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

crema_d