- Descriptif :
VoxForge est un ensemble de données de classification des langues. Il se compose de clips audio soumis par l'utilisateur et soumis sur le site Web. Dans cette version, les données de 6 langues sont collectées - anglais, espagnol, français, allemand, russe et italien. Étant donné que le site Web est constamment mis à jour, et dans un souci de reproductibilité, ce communiqué ne contient que les enregistrements soumis avant le 2020-01-01. Les échantillons sont répartis entre le train, la validation et le test afin que les échantillons de chaque locuteur appartiennent à exactement une division.
Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : http://www.voxforge.org/
Code source :
tfds.audio.Voxforge
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
Unknown size
Taille du jeu de données :
Unknown size
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans
download_config.manual_dir
(par défaut~/tensorflow_datasets/downloads/manual/
) :
VoxForge nécessite le téléchargement manuel des archives audio. La liste complète des archives peut être trouvée dans https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Elle peut être téléchargée en utilisant la commande suivante : wget -i voxforge_urls.txt -x Notez que le téléchargement et la construction de l'ensemble de données localement nécessite environ 100 Go d'espace disque (mais seulement ~ 60 Go seront utilisés en permanence).Mise en cache automatique ( documentation ): Inconnu
Fractionnements :
Diviser | Exemples |
---|
- Structure des fonctionnalités :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
l'audio | l'audio | (Aucun,) | int64 | |
étiquette | Étiquette de classe | int64 | ||
id_haut-parleur | Tenseur | chaîne de caractères |
Touches supervisées (Voir
as_supervised
doc ):('audio', 'label')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ) : Manquant.
Citation :
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}