gtzan_music_speech

  • Açıklama :

Veri seti, müzik/konuşma ayrımı amacıyla toplanmıştır. Veri seti, her biri 30 saniye uzunluğunda olan 120 parçadan oluşmaktadır. Her sınıf (müzik/konuşma) 60 örneğe sahiptir. Parçaların tümü, .wav biçimindeki 22050Hz Mono 16 bit ses dosyalarıdır.

Bölmek örnekler
'train' 128
  • Özellik yapısı :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
ses Ses (Hiçbiri,) int64
ses/dosya adı Metin sicim
etiket SınıfEtiketi int64
  • Alıntı :
@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}