- Açıklama :
Veri seti, her biri 30 saniye uzunluğunda 1000 ses parçasından oluşur. Her biri 100 parça ile temsil edilen 10 tür içerir. Parçaların tümü, .wav biçimindeki 22050Hz Mono 16 bit ses dosyalarıdır.
Türler:
- blues
- klasik
- ülke
- disko
- hiphop
- caz
- metal
- pop
- reggae
kaynak
Anasayfa : http://marsyas.info/index.html
Kaynak kodu :
tfds.audio.gtzan.GTZAN
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
1.14 GiB
Veri kümesi boyutu :
3.71 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
ses | Ses | (Hiçbiri,) | int64 | |
ses/dosya adı | Metin | sicim | ||
etiket | SınıfEtiketi | int64 |
Denetlenen tuşlar (Bkz
as_supervised
doc ):('audio', 'label')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}