voxforge

  • Descriptif :

VoxForge est un ensemble de données de classification des langues. Il se compose de clips audio soumis par l'utilisateur et soumis sur le site Web. Dans cette version, les données de 6 langues sont collectées - anglais, espagnol, français, allemand, russe et italien. Étant donné que le site Web est constamment mis à jour, et dans un souci de reproductibilité, ce communiqué ne contient que les enregistrements soumis avant le 2020-01-01. Les échantillons sont répartis entre le train, la validation et le test afin que les échantillons de chaque locuteur appartiennent à exactement une division.

  • Documentation complémentaire : Explorer sur Papers With Code

  • Page d'accueil : http://www.voxforge.org/

  • Code source : tfds.audio.Voxforge

  • Versions :

    • 1.0.0 (par défaut) : aucune note de version.
  • Taille du téléchargement : Unknown size

  • Taille du jeu de données : Unknown size

  • Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ) :
    VoxForge nécessite le téléchargement manuel des archives audio. La liste complète des archives peut être trouvée dans https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Elle peut être téléchargée en utilisant la commande suivante : wget -i voxforge_urls.txt -x Notez que le téléchargement et la construction de l'ensemble de données localement nécessite environ 100 Go d'espace disque (mais seulement ~ 60 Go seront utilisés en permanence).

  • Mise en cache automatique ( documentation ): Inconnu

  • Fractionnements :

Diviser Exemples
  • Structure des fonctionnalités :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
l'audio l'audio (Aucun,) int64
étiquette Étiquette de classe int64
id_haut-parleur Tenseur chaîne de caractères
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}