- الوصف :
تتكون مجموعة البيانات من 1000 مسار صوتي كل 30 ثانية. يحتوي على 10 أنواع ، يمثل كل منها 100 مسار. المسارات هي جميع ملفات الصوت أحادية 16 بت 22050 هرتز بتنسيق .wav.
الأنواع هي:
- البلوز
- كلاسيكي
- بلد
- ديسكو
- هيب هوب
- موسيقى الجاز
- فلز
- البوب
- الريغي
صخر
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : http://marsyas.info/index.html
كود المصدر :
tfds.audio.gtzan.GTZAN
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
1.14 GiB
حجم مجموعة البيانات :
3.71 GiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'train' | 1،000 |
- هيكل الميزة :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
صوتي | صوتي | (لا أحد،) | int64 | |
الصوت / اسم الملف | نص | سلسلة | ||
ضع الكلمة المناسبة | ClassLabel | int64 |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('audio', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}