Mfcc

публичный финальный класс Mfcc

Преобразует спектрограмму в форму, удобную для распознавания речи.

Частотно-кепстральные коэффициенты Mel — это способ представления аудиоданных, который эффективен в качестве входной функции для машинного обучения. Они создаются путем взятия спектра спектрограммы («кепстра») и отбрасывания некоторых более высоких частот, которые менее значимы для человеческого уха. Они имеют долгую историю в мире распознавания речи, и https://en.wikipedia.org/wiki/Mel- Frequency_cepstrum — хороший ресурс, чтобы узнать больше.

Вложенные классы

сорт Mfcc.Параметры Дополнительные атрибуты для Mfcc

Константы

Нить OP_NAME Название этой операции, известное основному движку TensorFlow.

Публичные методы

Вывод <TFloat32>
какВывод ()
Возвращает символический дескриптор тензора.
статический Mfcc
create (Область видимости , Операнд <TFloat32> спектрограмма, Операнд <TInt32> sampleRate, Опции... опции)
Фабричный метод для создания класса, обертывающего новую операцию Mfcc.
статический Mfcc.Options
dctCoefficientCount (длинный dctCoefficientCount)
статический Mfcc.Options
filterbankChannelCount (длинный filterbankChannelCount)
статический Mfcc.Options
lowFrequencyLimit (Float lowFrequencyLimit)
Вывод <TFloat32>
статический Mfcc.Options
UpperFrequencyLimit (Float UpperFrequencyLimit)

Унаследованные методы

Константы

общедоступная статическая финальная строка OP_NAME

Название этой операции, известное основному движку TensorFlow.

Постоянное значение: «Mfcc»

Публичные методы

публичный вывод <TFloat32> asOutput ()

Возвращает символический дескриптор тензора.

Входные данные для операций TensorFlow являются выходными данными другой операции TensorFlow. Этот метод используется для получения символического дескриптора, который представляет собой вычисление входных данных.

public static Mfcc create (область действия , операнд <TFloat32> спектрограмма, операнд <TInt32> sampleRate, параметры... параметры)

Фабричный метод для создания класса, обертывающего новую операцию Mfcc.

Параметры
объем текущий объем
спектрограмма Обычно создается с помощью операции Spectrogram, где для параметра value_squared установлено значение true.
частота дискретизации Сколько семплов в секунду использовал исходный звук.
параметры содержит значения необязательных атрибутов
Возврат
  • новый экземпляр Mfcc

общедоступный статический Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

Параметры
dctCoefficientCount Сколько выходных каналов создавать за один временной интервал.

общедоступный статический Mfcc.Options filterbankChannelCount (длинный filterbankChannelCount)

Параметры
фильтрбанкChannelCount Разрешение банка Мел используется для внутреннего использования.

общедоступный статический Mfcc.Options lowFrequencyLimit (Float lowFrequencyLimit)

Параметры
нижний предел частоты Самая низкая частота, используемая при вычислении кепстра.

публичный вывод <TFloat32> вывод ()

общедоступный статический Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)

Параметры
верхний предел частоты Самая высокая частота, используемая при вычислении кепстра.