gtzan

Descrizione :

Il set di dati è composto da 1000 tracce audio ciascuna della durata di 30 secondi. Contiene 10 generi, ciascuno rappresentato da 100 tracce. Le tracce sono tutte file audio 22050Hz Mono 16-bit in formato .wav.

I generi sono:

blues
classico
nazione
discoteca
hip-hop
jazz
metallo
pop
reggae
roccia
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : http://marsia.info/index.html
Codice sorgente : tfds.audio.gtzan.GTZAN
Versioni :
- 1.0.0 (impostazione predefinita): nessuna nota di rilascio.
Dimensione del download : 1.14 GiB
Dimensione del set di dati: 3.71 GiB
Cache automatica ( documentazione ): No
Divisioni :

Diviso	Esempi
`'train'`	1.000

Struttura delle caratteristiche :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Forma	Tipo D
	CaratteristicheDict
Audio	Audio	(Nessuno,)	int64
audio/nome file	Testo		corda
etichetta	ClassLabel		int64

Chiavi supervisionate (Vedi as_supervised doc ): ('audio', 'label')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):

Citazione :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

gtzan Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

gtzan