- Descrizione :
VoxForge è un set di dati di classificazione delle lingue. Consiste in clip audio inviate dall'utente inviate al sito web. In questa versione vengono raccolti dati da 6 lingue: inglese, spagnolo, francese, tedesco, russo e italiano. Poiché il sito Web è costantemente aggiornato e per motivi di riproducibilità, questa versione contiene solo registrazioni inviate prima del 2020-01-01. I campioni vengono suddivisi tra addestramento, convalida e test in modo che i campioni di ciascun diffusore appartengano esattamente a una divisione.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : http://www.voxforge.org/
Codice sorgente :
tfds.audio.Voxforge
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensioni del download :
Unknown size
Dimensioni del set di dati :
Unknown size
Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in
download_config.manual_dir
(il valore predefinito~/tensorflow_datasets/downloads/manual/
):
VoxForge richiede il download manuale degli archivi audio. L'elenco completo degli archivi può essere trovato in https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Può essere scaricato utilizzando il seguente comando: wget -i voxforge_urls.txt -x Si noti che il download e la creazione del set di dati in locale richiede ~ 100 GB di spazio su disco (ma solo ~ 60 GB verranno utilizzati in modo permanente).Cache automatica ( documentazione ): Sconosciuto
Divisioni :
Diviso | Esempi |
---|
- Struttura delle caratteristiche :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Audio | Audio | (Nessuno,) | int64 | |
etichetta | ClassLabel | int64 | ||
id_altoparlante | Tensore | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('audio', 'label')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ): Mancante.
Citazione :
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}