- Descripción :
VoxForge es un conjunto de datos de clasificación de idiomas. Consiste en clips de audio enviados por el usuario enviados al sitio web. En esta versión, se recopilan datos de 6 idiomas: inglés, español, francés, alemán, ruso e italiano. Dado que el sitio web se actualiza constantemente, y en aras de la reproducibilidad, este comunicado contiene solo grabaciones enviadas antes del 2020-01-01. Las muestras se dividen entre entrenamiento, validación y prueba para que las muestras de cada hablante pertenezcan exactamente a una división.
Documentación adicional : Explore en Papers With Code
Página de inicio : http://www.voxforge.org/
Código fuente :
tfds.audio.Voxforge
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de descarga :
Unknown size
Tamaño del conjunto de datos :
Unknown size
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en
download_config.manual_dir
(el valor predeterminado es~/tensorflow_datasets/downloads/manual/
):
VoxForge requiere la descarga manual de los archivos de audio. La lista completa de archivos se puede encontrar en https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Se puede descargar usando el siguiente comando: wget -i voxforge_urls.txt -x Tenga en cuenta que la descarga y construir el conjunto de datos localmente requiere ~ 100 GB de espacio en disco (pero solo se usarán ~ 60 GB de forma permanente).Auto-caché ( documentación ): Desconocido
Divisiones :
Separar | Ejemplos |
---|
- Estructura de características :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
audio | Audio | (Ninguna,) | int64 | |
etiqueta | Etiqueta de clase | int64 | ||
altavoz_id | Tensor | cuerda |
Teclas supervisadas (Ver
as_supervised
):('audio', 'label')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ): Falta.
Cita :
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}