حفظ

  • الوصف :

SAVEE (Surrey Audio-Visual Expressed Emotion) عبارة عن مجموعة بيانات للتعرف على المشاعر. يتكون من تسجيلات من 4 ممثلين ذكور في 7 مشاعر مختلفة ، إجمالي 480 نطقًا بالإنجليزية البريطانية. تم اختيار الجمل من مجموعة TIMIT المعيارية ومتوازنة صوتيًا لكل عاطفة. يحتوي هذا الإصدار فقط على دفق الصوت من التسجيل الصوتي والمرئي الأصلي.

يتم تقسيم البيانات بحيث تتكون مجموعة التدريب من متحدثين ، وتتكون كل من مجموعة التحقق والاختبار من عينات من مكبر صوت واحد ، على التوالي.

  • وثائق إضافية : استكشف في الأوراق باستخدام الرمز

  • الصفحة الرئيسية : http://kahlan.eps.surrey.ac.uk/savee/

  • كود المصدر : tfds.datasets.savee.Builder

  • إصدارات :

    • 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التنزيل : Unknown size

  • حجم مجموعة البيانات : 259.15 MiB

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    يجب أن يحتوي manual_dir على الملف AudioData.zip. يجب أن يكون هذا الملف ضمن Data / Zip / AudioData.zip في مجلد مجموعة البيانات المقدم عند التسجيل. تحتاج إلى التسجيل في http://personal.ee.surrey.ac.uk/Personal/P.Jackson/SAVEE/Register.html للحصول على رابط تنزيل مجموعة البيانات.

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'test' 120
'train' 240
'validation' 120
  • هيكل الميزة :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'speaker_id': string,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صوتي صوتي (لا أحد،) int64
ضع الكلمة المناسبة ClassLabel int64
Speaker_id موتر سلسلة
  • الاقتباس :
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}