voxforge

Descriptif :

VoxForge est un ensemble de données de classification des langues. Il se compose de clips audio soumis par l'utilisateur et soumis sur le site Web. Dans cette version, les données de 6 langues sont collectées - anglais, espagnol, français, allemand, russe et italien. Étant donné que le site Web est constamment mis à jour, et dans un souci de reproductibilité, ce communiqué ne contient que les enregistrements soumis avant le 2020-01-01. Les échantillons sont répartis entre le train, la validation et le test afin que les échantillons de chaque locuteur appartiennent à exactement une division.

Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : http://www.voxforge.org/
Code source : tfds.audio.Voxforge
Versions :
- 1.0.0 (par défaut) : aucune note de version.
Taille du téléchargement : Unknown size
Taille du jeu de données : Unknown size
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ) :
VoxForge nécessite le téléchargement manuel des archives audio. La liste complète des archives peut être trouvée dans https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Elle peut être téléchargée en utilisant la commande suivante : wget -i voxforge_urls.txt -x Notez que le téléchargement et la construction de l'ensemble de données localement nécessite environ 100 Go d'espace disque (mais seulement ~ 60 Go seront utilisés en permanence).
Mise en cache automatique ( documentation ): Inconnu
Fractionnements :

Diviser	Exemples

Structure des fonctionnalités :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})

Documentation des fonctionnalités :

Caractéristique	Classer	Forme	Dtype
	FonctionnalitésDict
l'audio	l'audio	(Aucun,)	int64
étiquette	Étiquette de classe		int64
id_haut-parleur	Tenseur		chaîne de caractères

Touches supervisées (Voir as_supervised doc ): ('audio', 'label')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ) : Manquant.
Citation :

@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}

voxforge Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

voxforge