gtzan

  • الوصف :

تتكون مجموعة البيانات من 1000 مسار صوتي كل 30 ثانية. يحتوي على 10 أنواع ، يمثل كل منها 100 مسار. المسارات هي جميع ملفات الصوت أحادية 16 بت 22050 هرتز بتنسيق .wav.

الأنواع هي:

انشق، مزق أمثلة
'train' 1،000
  • هيكل الميزة :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صوتي صوتي (لا أحد،) int64
الصوت / اسم الملف نص سلسلة
ضع الكلمة المناسبة ClassLabel int64
  • الاقتباس :
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}