Conozca lo último en aprendizaje automático, IA generativa y más en el Simposio WiML 2023.

Se usó la API de Cloud Translation para traducir esta página.

sí No

Descripción :

Sesenta grabaciones de un individuo diciendo sí o no en hebreo; cada grabación tiene ocho palabras.

El punto principal del conjunto de datos es proporcionar una manera fácil y rápida de probar los scripts de Kaldi de forma gratuita.

El archivo "waves_yesno.tar.gz" contiene 60 archivos .wav, muestreados a 8 kHz. Todos fueron grabados por el mismo hablante masculino, en hebreo. En cada archivo, el individuo dice 8 palabras; cada palabra es el hebreo para "sí" o "no", por lo que cada archivo es una secuencia aleatoria de 8 sí-s o noes. No se proporciona una transcripción separada; la secuencia está codificada en el nombre del archivo, con 1 para sí y 0 para no.

Documentación adicional : Explore en Papers With Code
Página de inicio: https://www.openslr.org/1/
Código fuente : tfds.audio.yesno.YesNo
Versiones :
- 1.0.0 (predeterminado): Sin notas de la versión.
Tamaño de la descarga : 4.49 MiB
Tamaño del conjunto de datos : 16.27 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	60

Estructura de características :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
audio	Audio	(Ninguna,)	int64
audio/nombre de archivo	Texto		cuerda
etiqueta	Secuencia (Etiqueta de clase)	(Ninguna,)	int64

Teclas supervisadas (Ver as_supervised ): ('audio', 'label')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):

Cita :

@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}

sí No Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

sí No