- Descriptif :
L'ensemble de données a été collecté à des fins de discrimination par la musique/la parole. L'ensemble de données se compose de 120 pistes, chacune d'une durée de 30 secondes. Chaque classe (musique/parole) a 60 exemples. Les pistes sont toutes des fichiers audio 22050 Hz Mono 16 bits au format .wav.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : http://marsyas.info/index.html
Code source :
tfds.audio.gtzan_music_speech.GTZANMusicSpeech
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
283.29 MiB
Taille du jeu de données :
424.64 MiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 128 |
- Structure des fonctionnalités :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
l'audio | l'audio | (Aucun,) | int64 | |
audio/nom de fichier | Texte | chaîne de caractères | ||
étiquette | Étiquette de classe | int64 |
Touches supervisées (Voir
as_supervised
doc ):('audio', 'label')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@ONLINE {Music Speech,
author = "Tzanetakis, George",
title = "GTZAN Music/Speech Collection",
year = "1999",
url = "http://marsyas.info/index.html"
}