Mfcc

clase final publica mfcc

Transforma un espectrograma en una forma útil para el reconocimiento de voz.

Los coeficientes cepstrales de frecuencia de Mel son una forma de representar datos de audio que ha resultado eficaz como función de entrada para el aprendizaje automático. Se crean tomando el espectro de un espectrograma (un 'cepstrum') y descartando algunas de las frecuencias más altas que son menos significativas para el oído humano. Tienen una larga trayectoria en el mundo del reconocimiento de voz y https://en.wikipedia.org/wiki/Mel-frequency_cepstrum es un buen recurso para obtener más información.

Clases anidadas

clase Mfcc.Opciones Atributos opcionales para Mfcc

Constantes

Cadena OP_NOMBRE El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Métodos públicos

Salida <TFloat32>
como salida ()
Devuelve el identificador simbólico del tensor.
Mfcc estático
crear (alcance alcance , operando <TFloat32> espectrograma, operando <TInt32> sampleRate, opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación Mfcc.
Opciones estáticas de Mfcc
dctCoficientCount (dctCoficientCount largo)
Opciones estáticas de Mfcc
filterbankChannelCount (filterbankChannelCount largo)
Opciones estáticas de Mfcc
lowerFrequencyLimit (límite de frecuencia inferior flotante)
Salida <TFloat32>
Opciones estáticas de Mfcc
límite de frecuencia superior (límite de frecuencia superior flotante)

Métodos heredados

Constantes

Cadena final estática pública OP_NAME

El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Valor constante: "Mfcc"

Métodos públicos

Salida pública <TFloat32> asOutput ()

Devuelve el identificador simbólico del tensor.

Las entradas a las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.

creación de Mfcc estática pública (alcance de alcance , espectrograma de operando <TFloat32> , operando <TInt32> sampleRate, opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación Mfcc.

Parámetros
alcance alcance actual
espectrograma Normalmente producido por la operación Espectrograma, con magnitud_squared establecida en verdadero.
tasa de muestra Cuántas muestras por segundo utilizó el audio fuente.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de Mfcc

público estático Mfcc.Options dctCoficientCount (dctCoficientCount largo)

Parámetros
dctCoeficienteRecuento Cuántos canales de salida producir por intervalo de tiempo.

público estático Mfcc.Options filterbankChannelCount (filterbankChannelCount largo)

Parámetros
filterbankChannelCount Resolución del banco Mel utilizada internamente.

público estático Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)

Parámetros
límite de frecuencia inferior La frecuencia más baja que se utilizará al calcular el ceptstrum.

Salida pública <TFloat32> salida ()

público estático Mfcc.Options UpperFrequencyLimit (flotante UpperFrequencyLimit)

Parámetros
límite de frecuencia superior La frecuencia más alta a utilizar al calcular el ceptstrum.