Mfcc

کلاس نهایی عمومی Mfcc

یک طیف نگار را به شکلی تبدیل می کند که برای تشخیص گفتار مفید است.

Mel Frequency Cepstral Coefficients راهی برای نمایش داده های صوتی است که به عنوان یک ویژگی ورودی برای یادگیری ماشین موثر بوده است. آنها با گرفتن طیف یک طیف‌نگار (یک «سپستروم»)، و دور انداختن برخی از فرکانس‌های بالاتر که برای گوش انسان اهمیت کمتری دارند، ایجاد می‌شوند. آنها سابقه طولانی در دنیای تشخیص گفتار دارند و https://en.wikipedia.org/wiki/Mel-frequency_cepsrum منبع خوبی برای کسب اطلاعات بیشتر است.

کلاس های تو در تو

کلاس Mfcc.Options ویژگی های اختیاری برای Mfcc

ثابت ها

رشته OP_NAME نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود

روش های عمومی

خروجی < TFloat32 >
asOutput ()
دسته نمادین تانسور را برمی گرداند.
Mfcc استاتیک
ایجاد ( scope scope، Operand < TFloat32 > spectrogram، Operand < TINT32 > sampleRate، Options... گزینه ها)
روش کارخانه برای ایجاد کلاسی که عملیات Mfcc جدید را بسته بندی می کند.
Static Mfcc.Options
dctCoefficientCount (تعداد ضریب طولانی dct)
Static Mfcc.Options
filterbankChannelCount (Long filterbankChannelCount)
Static Mfcc.Options
LowFrequencyLimit (Float LowFrequencyLimit)
خروجی < TFloat32 >
Static Mfcc.Options
upperFrequencyLimit (Float upperFrequencyLimit)

روش های ارثی

ثابت ها

رشته نهایی ثابت عمومی OP_NAME

نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود

مقدار ثابت: "Mfcc"

روش های عمومی

خروجی عمومی < TFloat32 > asOutput ()

دسته نمادین تانسور را برمی گرداند.

ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.

ایجاد Mfcc استاتیک عمومی (حوزه دامنه ، عملوند < TFloat32 > طیف نگار، عملوند < TINT32 > نرخ نمونه، گزینه‌ها... گزینه‌ها)

روش کارخانه برای ایجاد کلاسی که عملیات Mfcc جدید را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
طیف نگار معمولاً توسط Spectrogram op تولید می‌شود، با magnitude_squared تنظیم شده روی true.
نرخ نمونه چند نمونه در ثانیه از صدای منبع استفاده شده است.
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از Mfcc

عمومی static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

مولفه های
dctCoefficientCount چند کانال خروجی در هر برش زمانی تولید شود.

عمومی static Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)

مولفه های
filterbankChannelCount قطعنامه بانک مل استفاده داخلی.

Public Static Mfcc.Options LowFrequencyLimit (Float lowFrequencyLimit)

مولفه های
محدود فرکانس پایین کمترین فرکانس مورد استفاده در هنگام محاسبه سپستروم.

خروجی عمومی < TFloat32 > خروجی ()

عمومی static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)

مولفه های
محدودیت فرکانس بالا بیشترین فرکانس مورد استفاده در هنگام محاسبه سپستروم.