- Descripción :
Sesenta grabaciones de un individuo diciendo sí o no en hebreo; cada grabación tiene ocho palabras.
El punto principal del conjunto de datos es proporcionar una manera fácil y rápida de probar los scripts de Kaldi de forma gratuita.
El archivo "waves_yesno.tar.gz" contiene 60 archivos .wav, muestreados a 8 kHz. Todos fueron grabados por el mismo hablante masculino, en hebreo. En cada archivo, el individuo dice 8 palabras; cada palabra es el hebreo para "sí" o "no", por lo que cada archivo es una secuencia aleatoria de 8 sí-s o noes. No se proporciona una transcripción separada; la secuencia está codificada en el nombre del archivo, con 1 para sí y 0 para no.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://www.openslr.org/1/
Código fuente :
tfds.audio.yesno.YesNo
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de la descarga :
4.49 MiB
Tamaño del conjunto de datos :
16.27 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 60 |
- Estructura de características :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
audio | Audio | (Ninguna,) | int64 | |
audio/nombre de archivo | Texto | cuerda | ||
etiqueta | Secuencia (Etiqueta de clase) | (Ninguna,) | int64 |
Teclas supervisadas (Ver
as_supervised
):('audio', 'label')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}