Transforma un espectrograma en una forma útil para el reconocimiento de voz.
Los coeficientes cepstrales de frecuencia de Mel son una forma de representar datos de audio que ha resultado eficaz como función de entrada para el aprendizaje automático. Se crean tomando el espectro de un espectrograma (un 'cepstrum') y descartando algunas de las frecuencias más altas que son menos significativas para el oído humano. Tienen una larga trayectoria en el mundo del reconocimiento de voz y https://en.wikipedia.org/wiki/Mel-frequency_cepstrum es un buen recurso para obtener más información.
Clases anidadas
clase | Mfcc.Opciones | Atributos opcionales para Mfcc |
Constantes
Cadena | OP_NOMBRE | El nombre de esta operación, como lo conoce el motor central de TensorFlow. |
Métodos públicos
Salida <TFloat32> | como salida () Devuelve el identificador simbólico del tensor. |
Mfcc estático | crear (alcance alcance , operando <TFloat32> espectrograma, operando <TInt32> sampleRate, opciones... opciones) Método de fábrica para crear una clase que envuelve una nueva operación Mfcc. |
Opciones estáticas de Mfcc | dctCoficientCount (dctCoficientCount largo) |
Opciones estáticas de Mfcc | filterbankChannelCount (filterbankChannelCount largo) |
Opciones estáticas de Mfcc | lowerFrequencyLimit (límite de frecuencia inferior flotante) |
Salida <TFloat32> | producción () |
Opciones estáticas de Mfcc | límite de frecuencia superior (límite de frecuencia superior flotante) |
Métodos heredados
Constantes
Cadena final estática pública OP_NAME
El nombre de esta operación, como lo conoce el motor central de TensorFlow.
Métodos públicos
Salida pública <TFloat32> asOutput ()
Devuelve el identificador simbólico del tensor.
Las entradas a las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.
creación de Mfcc estática pública (alcance de alcance , espectrograma de operando <TFloat32> , operando <TInt32> sampleRate, opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación Mfcc.
Parámetros
alcance | alcance actual |
---|---|
espectrograma | Normalmente producido por la operación Espectrograma, con magnitud_squared establecida en verdadero. |
tasa de muestra | Cuántas muestras por segundo utilizó el audio fuente. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de Mfcc
público estático Mfcc.Options dctCoficientCount (dctCoficientCount largo)
Parámetros
dctCoeficienteRecuento | Cuántos canales de salida producir por intervalo de tiempo. |
---|
público estático Mfcc.Options filterbankChannelCount (filterbankChannelCount largo)
Parámetros
filterbankChannelCount | Resolución del banco Mel utilizada internamente. |
---|
público estático Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)
Parámetros
límite de frecuencia inferior | La frecuencia más baja que se utilizará al calcular el ceptstrum. |
---|
público estático Mfcc.Options UpperFrequencyLimit (flotante UpperFrequencyLimit)
Parámetros
límite de frecuencia superior | La frecuencia más alta a utilizar al calcular el ceptstrum. |
---|