Spektrogramı konuşma tanıma için kullanışlı bir forma dönüştürür.
Mel Frekansı Cepstral Katsayıları, makine öğrenimi için bir giriş özelliği olarak etkili olan ses verilerini temsil etmenin bir yoludur. Bir spektrogramın (bir 'sepstrum') spektrumu alınarak ve insan kulağı için daha az önemli olan bazı yüksek frekansların atılmasıyla oluşturulurlar. Konuşma tanıma dünyasında uzun bir geçmişleri var ve https://en.wikipedia.org/wiki/Mel-frequency_cepstrum daha fazlasını öğrenmek için iyi bir kaynak.
İç İçe Sınıflar
sınıf | Mfcc.Seçenekler | Mfcc için isteğe bağlı özellikler |
Sabitler
Sicim | OP_NAME | Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı |
Genel Yöntemler
Çıkış < TFloat32 > | Çıkış olarak () Tensörün sembolik tutamacını döndürür. |
statik Mfcc | |
statik Mfcc.Seçenekler | dctCoactiveCount (Uzun dctCoactiveCount) |
statik Mfcc.Seçenekler | filterbankChannelCount (Uzun filtre bankasıChannelCount) |
statik Mfcc.Seçenekler | altFrequencyLimit (Float altFrequencyLimit) |
Çıkış < TFloat32 > | çıktı () |
statik Mfcc.Seçenekler | üstFrequencyLimit (Float üstFrequencyLimit) |
Kalıtsal Yöntemler
Sabitler
genel statik son Dize OP_NAME
Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı
Genel Yöntemler
genel Çıkış < TFloat32 > asOutput ()
Tensörün sembolik tutamacını döndürür.
TensorFlow işlemlerinin girdileri, başka bir TensorFlow işleminin çıktılarıdır. Bu yöntem, girişin hesaplanmasını temsil eden sembolik bir tanıtıcı elde etmek için kullanılır.
public static Mfcc create ( Kapsam kapsamı, İşlenen < TFloat32 > spektrogram, İşlenen < TInt32 > sampleRate, Seçenekler... seçenekler)
Yeni bir Mfcc işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
Parametreler
kapsam | mevcut kapsam |
---|---|
spektrogram | Tipik olarak Spectrogram operasyonu tarafından, magnument_squared true olarak ayarlanarak üretilir. |
aynı oran | Kaynak sesin saniyede kaç örnek kullandığı. |
seçenekler | isteğe bağlı nitelik değerlerini taşır |
İadeler
- Mfcc'nin yeni bir örneği
public static Mfcc.Options dctCothirdCount (Long dctCothirdCount)
Parametreler
dctKatsayısıSayısı | Zaman dilimi başına kaç çıkış kanalı üretileceği. |
---|
genel statik Mfcc.Options filterbankChannelCount (Uzun filtre bankasıChannelCount)
Parametreler
filtre bankasıChannelCount | Dahili olarak kullanılan Mel bankasının çözünürlüğü. |
---|
public static Mfcc.Options LowerFrequencyLimit (Float LowerFrequencyLimit)
Parametreler
alt FrekansLimit | Septtrum hesaplanırken kullanılacak en düşük frekans. |
---|
public static Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)
Parametreler
üst FrekansLimit | Septtrum hesaplanırken kullanılacak en yüksek frekans. |
---|