یک طیف نگار را به شکلی تبدیل می کند که برای تشخیص گفتار مفید است.
Mel Frequency Cepstral Coefficients راهی برای نمایش داده های صوتی است که به عنوان یک ویژگی ورودی برای یادگیری ماشین موثر بوده است. آنها با گرفتن طیف یک طیفنگار (یک «سپستروم»)، و دور انداختن برخی از فرکانسهای بالاتر که برای گوش انسان اهمیت کمتری دارند، ایجاد میشوند. آنها سابقه طولانی در دنیای تشخیص گفتار دارند و https://en.wikipedia.org/wiki/Mel-frequency_cepsrum منبع خوبی برای کسب اطلاعات بیشتر است.
کلاس های تو در تو
کلاس | Mfcc.Options | ویژگی های اختیاری برای Mfcc |
ثابت ها
رشته | OP_NAME | نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود |
روش های عمومی
خروجی < TFloat32 > | asOutput () دسته نمادین تانسور را برمی گرداند. |
Mfcc استاتیک | |
Static Mfcc.Options | dctCoefficientCount (تعداد ضریب طولانی dct) |
Static Mfcc.Options | filterbankChannelCount (Long filterbankChannelCount) |
Static Mfcc.Options | LowFrequencyLimit (Float LowFrequencyLimit) |
خروجی < TFloat32 > | خروجی () |
Static Mfcc.Options | upperFrequencyLimit (Float upperFrequencyLimit) |
روش های ارثی
ثابت ها
رشته نهایی ثابت عمومی OP_NAME
نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود
روش های عمومی
خروجی عمومی < TFloat32 > asOutput ()
دسته نمادین تانسور را برمی گرداند.
ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.
ایجاد Mfcc استاتیک عمومی (حوزه دامنه ، عملوند < TFloat32 > طیف نگار، عملوند < TINT32 > نرخ نمونه، گزینهها... گزینهها)
روش کارخانه برای ایجاد کلاسی که عملیات Mfcc جدید را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
طیف نگار | معمولاً توسط Spectrogram op تولید میشود، با magnitude_squared تنظیم شده روی true. |
نرخ نمونه | چند نمونه در ثانیه از صدای منبع استفاده شده است. |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از Mfcc
عمومی static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)
مولفه های
dctCoefficientCount | چند کانال خروجی در هر برش زمانی تولید شود. |
---|
عمومی static Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)
مولفه های
filterbankChannelCount | قطعنامه بانک مل استفاده داخلی. |
---|
Public Static Mfcc.Options LowFrequencyLimit (Float lowFrequencyLimit)
مولفه های
محدود فرکانس پایین | کمترین فرکانس مورد استفاده در هنگام محاسبه سپستروم. |
---|
عمومی static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)
مولفه های
محدودیت فرکانس بالا | بیشترین فرکانس مورد استفاده در هنگام محاسبه سپستروم. |
---|