- Açıklama :
Veri seti, müzik/konuşma ayrımı amacıyla toplanmıştır. Veri seti, her biri 30 saniye uzunluğunda olan 120 parçadan oluşmaktadır. Her sınıf (müzik/konuşma) 60 örneğe sahiptir. Parçaların tümü, .wav biçimindeki 22050Hz Mono 16 bit ses dosyalarıdır.
Anasayfa : http://marsyas.info/index.html
Kaynak kodu :
tfds.audio.gtzan_music_speech.GTZANMusicSpeech
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
283.29 MiB
Veri kümesi boyutu :
424.64 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 128 |
- Özellik yapısı :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
ses | Ses | (Hiçbiri,) | int64 | |
ses/dosya adı | Metin | sicim | ||
etiket | SınıfEtiketi | int64 |
Denetlenen tuşlar (Bkz
as_supervised
doc ):('audio', 'label')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@ONLINE {Music Speech,
author = "Tzanetakis, George",
title = "GTZAN Music/Speech Collection",
year = "1999",
url = "http://marsyas.info/index.html"
}