sí No

  • Descripción :

Sesenta grabaciones de un individuo diciendo sí o no en hebreo; cada grabación tiene ocho palabras.

El punto principal del conjunto de datos es proporcionar una manera fácil y rápida de probar los scripts de Kaldi de forma gratuita.

El archivo "waves_yesno.tar.gz" contiene 60 archivos .wav, muestreados a 8 kHz. Todos fueron grabados por el mismo hablante masculino, en hebreo. En cada archivo, el individuo dice 8 palabras; cada palabra es el hebreo para "sí" o "no", por lo que cada archivo es una secuencia aleatoria de 8 sí-s o noes. No se proporciona una transcripción separada; la secuencia está codificada en el nombre del archivo, con 1 para sí y 0 para no.

Separar Ejemplos
'train' 60
  • Estructura de características :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
audio Audio (Ninguna,) int64
audio/nombre de archivo Texto cuerda
etiqueta Secuencia (Etiqueta de clase) (Ninguna,) int64
  • Cita :
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}