crema_d

توضیحات :

CREMA-D یک مجموعه داده صوتی و تصویری برای تشخیص احساسات است. مجموعه داده ها شامل حالات عاطفی چهره و صوتی در جملاتی است که در طیفی از حالات عاطفی اساسی (شادی، غمگین، خشم، ترس، انزجار، و خنثی) گفته می شود. 7442 کلیپ از 91 بازیگر با پیشینه های قومی مختلف جمع آوری شد. این نسخه فقط شامل جریان صوتی از ضبط صوتی و تصویری اصلی است. نمونه ها بین قطار، اعتبارسنجی و آزمایش تقسیم می شوند به طوری که نمونه های هر بلندگو دقیقاً به یک تقسیم تعلق دارد.

اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/CheyneyComputerScience/CREMA-D
کد منبع : tfds.audio.CremaD
نسخه ها :
- 1.0.0 (پیش فرض): بدون یادداشت انتشار.
حجم دانلود : 579.25 MiB
حجم مجموعه داده : 1.65 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'test'`	1556
`'train'`	5,144
`'validation'`	738

ساختار ویژگی :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
سمعی	سمعی	(هیچ یک،)	int64
برچسب	ClassLabel		int64
speaker_id	تانسور		رشته

کلیدهای نظارت شده (مشاهده as_supervised doc ): ('audio', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}

crema_d با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

crema_d