Mfcc

পাবলিক ফাইনাল ক্লাস Mfcc

একটি স্পেকট্রোগ্রামকে একটি ফর্মে রূপান্তরিত করে যা বক্তৃতা শনাক্তকরণের জন্য উপযোগী।

মেল ফ্রিকোয়েন্সি সেপস্ট্রাল সহগ হল অডিও ডেটা উপস্থাপনের একটি উপায় যা মেশিন লার্নিং এর জন্য একটি ইনপুট বৈশিষ্ট্য হিসাবে কার্যকর হয়েছে। এগুলি একটি বর্ণালীগ্রাম (একটি 'সেপস্ট্রাম') এর বর্ণালী গ্রহণ করে এবং মানুষের কানের জন্য কম তাৎপর্যপূর্ণ কিছু উচ্চতর ফ্রিকোয়েন্সি বাতিল করে তৈরি করা হয়। বক্তৃতা শনাক্তকরণ জগতে তাদের একটি দীর্ঘ ইতিহাস রয়েছে এবং https://en.wikipedia.org/wiki/Mel-frequency_cepstrum আরও জানার জন্য একটি ভাল সম্পদ।

নেস্টেড ক্লাস

ক্লাস Mfcc. অপশন Mfcc এর জন্য ঐচ্ছিক বৈশিষ্ট্য

ধ্রুবক

স্ট্রিং OP_NAME এই অপের নাম, টেনসরফ্লো কোর ইঞ্জিন দ্বারা পরিচিত

পাবলিক পদ্ধতি

আউটপুট < TFloat32 >
আউটপুট হিসাবে ()
টেনসরের প্রতীকী হ্যান্ডেল ফেরত দেয়।
স্ট্যাটিক Mfcc
তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড < TFloat32 > স্পেকট্রোগ্রাম, অপারেন্ড < TInt32 > স্যাম্পল রেট, বিকল্প... বিকল্প)
একটি নতুন Mfcc অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।
স্ট্যাটিক Mfcc. অপশন
dctCoefficientCount (দীর্ঘ dctCoefficientCount)
স্ট্যাটিক Mfcc. অপশন
filterbankChannelCount (লং ফিল্টারব্যাঙ্ক চ্যানেল কাউন্ট)
স্ট্যাটিক Mfcc. অপশন
নিম্ন ফ্রিকোয়েন্সি লিমিট (ফ্লোট কম ফ্রিকোয়েন্সি লিমিট)
আউটপুট < TFloat32 >
স্ট্যাটিক Mfcc. অপশন
আপার ফ্রিকোয়েন্সি লিমিট (ফ্লোট ঊর্ধ্ব ফ্রিকোয়েন্সি লিমিট)

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

ধ্রুবক

সর্বজনীন স্ট্যাটিক চূড়ান্ত স্ট্রিং OP_NAME

এই অপের নাম, টেনসরফ্লো কোর ইঞ্জিন দ্বারা পরিচিত

ধ্রুবক মান: "Mfcc"

পাবলিক পদ্ধতি

সর্বজনীন আউটপুট < TFloat32 > asOutput ()

টেনসরের প্রতীকী হ্যান্ডেল ফেরত দেয়।

TensorFlow অপারেশনের ইনপুট হল অন্য TensorFlow অপারেশনের আউটপুট। এই পদ্ধতিটি একটি প্রতীকী হ্যান্ডেল পেতে ব্যবহৃত হয় যা ইনপুটের গণনাকে প্রতিনিধিত্ব করে।

পাবলিক স্ট্যাটিক এমএফসিসি তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড < TFloat32 > স্পেকট্রোগ্রাম, অপারেন্ড < TInt32 > স্যাম্পল রেট, বিকল্প... বিকল্প)

একটি নতুন Mfcc অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
বর্ণালীগ্রাম সাধারণত স্পেকট্রোগ্রাম অপ দ্বারা উত্পাদিত হয়, ম্যাগনিটিউড_স্কোয়ার্ড সত্যে সেট করে।
নমুনা হার উৎস অডিও প্রতি সেকেন্ডে কত নমুনা ব্যবহার করে।
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • Mfcc এর একটি নতুন উদাহরণ

পাবলিক স্ট্যাটিক Mfcc. Options dctCoefficientCount (লং dctCoefficientCount)

পরামিতি
dctCoefficientCount টাইম স্লাইস প্রতি কতগুলি আউটপুট চ্যানেল তৈরি করতে হবে।

পাবলিক স্ট্যাটিক Mfcc. Options filterbankChannelCount (লং ফিল্টারব্যাঙ্ক চ্যানেল কাউন্ট)

পরামিতি
filterbankChannelCount অভ্যন্তরীণভাবে ব্যবহৃত মেল ব্যাঙ্কের রেজোলিউশন।

সর্বজনীন স্ট্যাটিক Mfcc. অপশন নিম্ন ফ্রিকোয়েন্সি লিমিট (ফ্লোট কম ফ্রিকোয়েন্সি লিমিট)

পরামিতি
নিম্ন ফ্রিকোয়েন্সি লিমিট সেপ্টস্ট্রাম গণনা করার সময় ব্যবহার করার জন্য সর্বনিম্ন ফ্রিকোয়েন্সি।

সর্বজনীন আউটপুট < TFloat32 > আউটপুট ()

পাবলিক স্ট্যাটিক Mfcc. Options upperFrequency Limit (ফ্লোট upperFrequency Limit)

পরামিতি
উচ্চ ফ্রিকোয়েন্সি লিমিট সেপ্টস্ট্রাম গণনা করার সময় ব্যবহার করার জন্য সর্বোচ্চ ফ্রিকোয়েন্সি।