Przekształca spektrogram w formę przydatną do rozpoznawania mowy.
Współczynniki cepstralne częstotliwości Mel to sposób reprezentowania danych audio, który sprawdza się jako funkcja wejściowa w uczeniu maszynowym. Tworzy się je poprzez pobranie widma spektrogramu („cepstrum”) i odrzucenie niektórych wyższych częstotliwości, które są mniej istotne dla ludzkiego ucha. Mają długą historię w świecie rozpoznawania mowy, a https://en.wikipedia.org/wiki/Mel-frequency_cepstrum jest dobrym źródłem informacji, aby dowiedzieć się więcej.
Klasy zagnieżdżone
klasa | Opcje Mfcc | Opcjonalne atrybuty dla Mfcc |
Stałe
Strunowy | OP_NAME | Nazwa tej operacji znana silnikowi rdzenia TensorFlow |
Metody publiczne
Dane wyjściowe <TFloat32> | jako wyjście () Zwraca symboliczny uchwyt tensora. |
statyczny MFC | |
statyczne opcje Mfcc | dctCooperativeCount (długi dctCooperativeCount) |
statyczne opcje Mfcc | bank filtrówChannelCount (długi bank filtrówChannelCount) |
statyczne opcje Mfcc | LowerFrequencyLimit (pływający dolny limit częstotliwości) |
Dane wyjściowe <TFloat32> | wyjście () |
statyczne opcje Mfcc | UpperFrequencyLimit (pływający górny limit częstotliwości) |
Metody dziedziczone
Stałe
publiczny statyczny końcowy ciąg znaków OP_NAME
Nazwa tej operacji znana silnikowi rdzenia TensorFlow
Metody publiczne
publiczne wyjście < TFloat32 > asOutput ()
Zwraca symboliczny uchwyt tensora.
Dane wejściowe operacji TensorFlow są wynikami innej operacji TensorFlow. Ta metoda służy do uzyskania symbolicznego uchwytu reprezentującego obliczenia danych wejściowych.
public static Mfcc create ( Zakres zakresu, Operand < TFloat32 > spektrogram, Operand < TInt32 > sampleRate, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację Mfcc.
Parametry
zakres | aktualny zakres |
---|---|
spektrogram | Zazwyczaj generowane przez operację Spektrogram, z wartością_kwadratową ustawioną na wartość true. |
próbna stawka | Ile próbek na sekundę użyło źródło dźwięku. |
opcje | przenosi opcjonalne wartości atrybutów |
Zwroty
- nowa instancja Mfcc
public static Mfcc.Options dctCooperativeCount (długi dctCooperativeCount)
Parametry
dctCooperativeCount | Ile kanałów wyjściowych należy wygenerować w przedziale czasu. |
---|
publiczny statyczny bank filtrów Mfcc.OptionsChannelCount (długi bank filtrówChannelCount)
Parametry
bank filtrówChannelCount | Uchwała banku Mel stosowana wewnętrznie. |
---|
public static Mfcc.Options lessFrequencyLimit (Float dolnyLimitFrequencyLimit)
Parametry
dolny limit częstotliwości | Najniższa częstotliwość stosowana przy obliczaniu ceptstrum. |
---|
public static Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)
Parametry
górny limit częstotliwości | Najwyższa częstotliwość stosowana przy obliczaniu ceptstrum. |
---|