gtzan

  • Açıklama :

Veri seti, her biri 30 saniye uzunluğunda 1000 ses parçasından oluşur. Her biri 100 parça ile temsil edilen 10 tür içerir. Parçaların tümü, .wav biçimindeki 22050Hz Mono 16 bit ses dosyalarıdır.

Türler:

Bölmek örnekler
'train' 1.000
  • Özellik yapısı :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
ses Ses (Hiçbiri,) int64
ses/dosya adı Metin sicim
etiket SınıfEtiketi int64
  • Alıntı :
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}