Mfcc

kelas akhir publik Mfcc

Mengubah spektogram menjadi bentuk yang berguna untuk pengenalan suara.

Koefisien Cepstral Frekuensi Mel adalah cara merepresentasikan data audio yang efektif sebagai fitur masukan untuk pembelajaran mesin. Mereka diciptakan dengan mengambil spektrum spektogram ('cepstrum'), dan membuang beberapa frekuensi tinggi yang kurang signifikan bagi telinga manusia. Mereka memiliki sejarah panjang dalam dunia pengenalan suara, dan https://en.wikipedia.org/wiki/Mel-frekuensi_cepstrum adalah sumber yang bagus untuk mempelajari lebih lanjut.

Kelas Bersarang

kelas Mfcc.Opsi Atribut opsional untuk Mfcc

Konstanta

Rangkaian OP_NAME Nama operasi ini dikenal dengan mesin inti TensorFlow

Metode Publik

Keluaran < TFloat32 >
sebagai Keluaran ()
Mengembalikan pegangan simbolik tensor.
Mfcc statis
buat ( Lingkup lingkup, Operan < TFloat32 > spektogram, Operan < TInt32 > sampleRate, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi Mfcc baru.
Mfcc.Options statis
dctCoefisienCount (dctCoefisienCount panjang)
Mfcc.Options statis
filterbankChannelCount (FilterbankChannelCount panjang)
Mfcc.Options statis
LowerFrequencyLimit (Batas Frekuensi Rendah Float)
Keluaran < TFloat32 >
Mfcc.Options statis
BatasFrekuensi atas (BatasFrekuensi Atas Apung)

Metode Warisan

Konstanta

String akhir statis publik OP_NAME

Nama operasi ini dikenal dengan mesin inti TensorFlow

Nilai Konstan: "Mfcc"

Metode Publik

Keluaran publik < TFloat32 > asOutput ()

Mengembalikan pegangan simbolik tensor.

Masukan ke operasi TensorFlow adalah keluaran dari operasi TensorFlow lainnya. Metode ini digunakan untuk mendapatkan pegangan simbolis yang mewakili perhitungan input.

pembuatan Mfcc statis publik ( Lingkup lingkup, Operan < TFloat32 > spektogram, Operan < TInt32 > sampleRate, Opsi... opsi)

Metode pabrik untuk membuat kelas yang membungkus operasi Mfcc baru.

Parameter
cakupan ruang lingkup saat ini
spektogram Biasanya dihasilkan oleh operasi Spectogram, dengan magnitudo_squared disetel ke true.
tingkat sampel Berapa banyak sampel per detik sumber audio yang digunakan.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru dari Mfcc

Mfcc.Options statis publik dctCoefisienCount (DctCoefisienCount panjang)

Parameter
dctCoefisienCount Berapa banyak saluran keluaran yang harus diproduksi per irisan waktu.

public static Mfcc.Options filterbankChannelCount (FilterbankChannelCount panjang)

Parameter
filterbankChannelCount Resolusi bank Mel digunakan secara internal.

Mfcc.Options lowerFrequencyLimit statis publik (Float lowerFrequencyLimit)

Parameter
Batas Frekuensi yang lebih rendah Frekuensi terendah yang digunakan saat menghitung cepttrum.

Keluaran publik < TFloat32 > keluaran ()

Mfcc.Options upperFrequencyLimit statis publik (Float upperFrequencyLimit)

Parameter
Batas Frekuensi atas Frekuensi tertinggi yang digunakan saat menghitung cepttrum.