Mfcc

publiczne zajęcia końcowe Mfcc

Przekształca spektrogram w formę przydatną do rozpoznawania mowy.

Współczynniki cepstralne częstotliwości Mel to sposób reprezentowania danych audio, który sprawdza się jako funkcja wejściowa w uczeniu maszynowym. Tworzy się je poprzez pobranie widma spektrogramu („cepstrum”) i odrzucenie niektórych wyższych częstotliwości, które są mniej istotne dla ludzkiego ucha. Mają długą historię w świecie rozpoznawania mowy, a https://en.wikipedia.org/wiki/Mel-frequency_cepstrum jest dobrym źródłem informacji, aby dowiedzieć się więcej.

Klasy zagnieżdżone

klasa Opcje Mfcc Opcjonalne atrybuty dla Mfcc

Stałe

Strunowy OP_NAME Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Metody publiczne

Dane wyjściowe <TFloat32>
jako wyjście ()
Zwraca symboliczny uchwyt tensora.
statyczny MFC
utwórz ( Zakres zakresu, Operand < TFloat32 > spektrogram, Operand < TInt32 > sampleRate, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację Mfcc.
statyczne opcje Mfcc
dctCooperativeCount (długi dctCooperativeCount)
statyczne opcje Mfcc
bank filtrówChannelCount (długi bank filtrówChannelCount)
statyczne opcje Mfcc
LowerFrequencyLimit (pływający dolny limit częstotliwości)
Dane wyjściowe <TFloat32>
statyczne opcje Mfcc
UpperFrequencyLimit (pływający górny limit częstotliwości)

Metody dziedziczone

org.tensorflow.op.RawOp
końcowa wartość logiczna
równa się (obiekt obiektu)
końcowy wew
Operacja
op ()
Zwróć tę jednostkę obliczeniową jako pojedynczą Operation .
ostatni ciąg
wartość logiczna
równa się (Obiekt arg0)
ostatnia klasa<?>
pobierzKlasę ()
wew
hashCode ()
ostateczna pustka
powiadomić ()
ostateczna pustka
powiadom wszystkich ()
Strunowy
doString ()
ostateczna pustka
czekaj (długi arg0, int arg1)
ostateczna pustka
czekaj (długi arg0)
ostateczna pustka
Czekać ()
org.tensorflow.op.Op
abstrakcyjne środowisko wykonania
środowisko ()
Zwróć środowisko wykonawcze, w którym utworzono tę operację.
abstrakcyjna operacja
op ()
Zwróć tę jednostkę obliczeniową jako pojedynczą Operation .
org.tensorflow.Operand
streszczenie Dane wyjściowe <TFloat32>
jako wyjście ()
Zwraca symboliczny uchwyt tensora.
streszczenie TFloat32
asTensor ()
Zwraca tensor tego operandu.
abstrakcyjny kształt
kształt ()
Zwraca (prawdopodobnie częściowo znany) kształt tensora, do którego odnosi się dane Output tego operandu.
Klasa abstrakcyjna <TFloat32>
typ ()
Zwraca typ tensora tego operandu
org.tensorflow.ndarray.Shaped
streszczenie wew
ranga ()
abstrakcyjny kształt
abstrakcyjne, długie
rozmiar ()
Oblicza i zwraca całkowity rozmiar tego kontenera w liczbie wartości.

Stałe

publiczny statyczny końcowy ciąg znaków OP_NAME

Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Wartość stała: „Mfcc”

Metody publiczne

publiczne wyjście < TFloat32 > asOutput ()

Zwraca symboliczny uchwyt tensora.

Dane wejściowe operacji TensorFlow są wynikami innej operacji TensorFlow. Ta metoda służy do uzyskania symbolicznego uchwytu reprezentującego obliczenia danych wejściowych.

public static Mfcc create ( Zakres zakresu, Operand < TFloat32 > spektrogram, Operand < TInt32 > sampleRate, Opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację Mfcc.

Parametry
zakres aktualny zakres
spektrogram Zazwyczaj generowane przez operację Spektrogram, z wartością_kwadratową ustawioną na wartość true.
próbna stawka Ile próbek na sekundę użyło źródło dźwięku.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja Mfcc

public static Mfcc.Options dctCooperativeCount (długi dctCooperativeCount)

Parametry
dctCooperativeCount Ile kanałów wyjściowych należy wygenerować w przedziale czasu.

publiczny statyczny bank filtrów Mfcc.OptionsChannelCount (długi bank filtrówChannelCount)

Parametry
bank filtrówChannelCount Uchwała banku Mel stosowana wewnętrznie.

public static Mfcc.Options lessFrequencyLimit (Float dolnyLimitFrequencyLimit)

Parametry
dolny limit częstotliwości Najniższa częstotliwość stosowana przy obliczaniu ceptstrum.

publiczne wyjście < TFloat32 > wyjście ()

public static Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)

Parametry
górny limit częstotliwości Najwyższa częstotliwość stosowana przy obliczaniu ceptstrum.