Mfcc

publiczne zajęcia końcowe Mfcc

Przekształca spektrogram w formę przydatną do rozpoznawania mowy.

Współczynniki cepstralne częstotliwości Mel to sposób reprezentowania danych audio, który sprawdza się jako funkcja wejściowa w uczeniu maszynowym. Tworzy się je poprzez pobranie widma spektrogramu („cepstrum”) i odrzucenie niektórych wyższych częstotliwości, które są mniej istotne dla ludzkiego ucha. Mają długą historię w świecie rozpoznawania mowy, a https://en.wikipedia.org/wiki/Mel-frequency_cepstrum jest dobrym źródłem informacji, aby dowiedzieć się więcej.

Klasy zagnieżdżone

klasa Opcje Mfcc Opcjonalne atrybuty dla Mfcc

Stałe

Strunowy OP_NAME Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Metody publiczne

Dane wyjściowe <TFloat32>
jako wyjście ()
Zwraca symboliczny uchwyt tensora.
statyczny MFC
utwórz ( Zakres zakresu, Operand < TFloat32 > spektrogram, Operand < TInt32 > sampleRate, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację Mfcc.
statyczne opcje Mfcc
dctCooperativeCount (długi dctCooperativeCount)
statyczne opcje Mfcc
bank filtrówChannelCount (długi bank filtrówChannelCount)
statyczne opcje Mfcc
LowerFrequencyLimit (pływający dolny limit częstotliwości)
Dane wyjściowe <TFloat32>
statyczne opcje Mfcc
UpperFrequencyLimit (pływający górny limit częstotliwości)

Metody dziedziczone

Stałe

publiczny statyczny końcowy ciąg znaków OP_NAME

Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Wartość stała: „Mfcc”

Metody publiczne

publiczne wyjście < TFloat32 > asOutput ()

Zwraca symboliczny uchwyt tensora.

Dane wejściowe operacji TensorFlow są wynikami innej operacji TensorFlow. Ta metoda służy do uzyskania symbolicznego uchwytu reprezentującego obliczenia danych wejściowych.

public static Mfcc create ( Zakres zakresu, Operand < TFloat32 > spektrogram, Operand < TInt32 > sampleRate, Opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację Mfcc.

Parametry
zakres aktualny zakres
spektrogram Zazwyczaj generowane przez operację Spektrogram, z wartością_kwadratową ustawioną na wartość true.
próbna stawka Ile próbek na sekundę użyło źródło dźwięku.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja Mfcc

public static Mfcc.Options dctCooperativeCount (długi dctCooperativeCount)

Parametry
dctCooperativeCount Ile kanałów wyjściowych należy wygenerować w przedziale czasu.

publiczny statyczny bank filtrów Mfcc.OptionsChannelCount (długi bank filtrówChannelCount)

Parametry
bank filtrówChannelCount Uchwała banku Mel stosowana wewnętrznie.

public static Mfcc.Options lessFrequencyLimit (Float dolnyLimitFrequencyLimit)

Parametry
dolny limit częstotliwości Najniższa częstotliwość stosowana przy obliczaniu ceptstrum.

publiczne wyjście < TFloat32 > wyjście ()

public static Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)

Parametry
górny limit częstotliwości Najwyższa częstotliwość stosowana przy obliczaniu ceptstrum.