แปลงสเปกโตรแกรมให้เป็นรูปแบบที่มีประโยชน์สำหรับการรู้จำคำพูด
ค่าสัมประสิทธิ์เซปสตรัลความถี่เมลเป็นวิธีหนึ่งในการแสดงข้อมูลเสียงที่มีประสิทธิภาพในฐานะฟีเจอร์อินพุตสำหรับแมชชีนเลิร์นนิง พวกมันถูกสร้างขึ้นโดยการใช้สเปกตรัมของสเปกตรัม ('เซปสตรัม') และละทิ้งความถี่ที่สูงกว่าบางส่วนซึ่งมีความสำคัญน้อยกว่าต่อหูของมนุษย์ พวกเขามีประวัติศาสตร์อันยาวนานในโลกแห่งการรู้จำเสียง และ https://en.wikipedia.org/wiki/Mel-frequency_cepstrum เป็นแหล่งข้อมูลที่ดีในการเรียนรู้เพิ่มเติม
คลาสที่ซ้อนกัน
ระดับ | Mfcc.ตัวเลือก | แอ็ตทริบิวต์ทางเลือกสำหรับ Mfcc |
ค่าคงที่
สตริง | OP_NAME | ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow |
วิธีการสาธารณะ
เอาท์พุต < TFloat32 > | เป็นเอาท์พุต () ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์ |
Mfcc แบบคงที่ | สร้าง (ขอบเขต ขอบเขต ตัวดำเนินการ < TFloat32 > สเปกโตรแกรม ตัวดำเนินการ < TInt32 > SampleRate ตัวเลือก... ตัวเลือก) วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ Mfcc ใหม่ |
Mfcc.Options แบบคงที่ | dctCoefficientCount (dctCoefficientCount แบบยาว) |
Mfcc.Options แบบคงที่ | filterbankChannelCount (กรองยาว BankChannelCount) |
Mfcc.Options แบบคงที่ | lowerFrequencyLimit (ลอยต่ำกว่าFrequencyLimit) |
เอาท์พุต < TFloat32 > | เอาท์พุท () |
Mfcc.Options แบบคงที่ | upperFrequencyLimit (ลอยบนFrequencyLimit) |
วิธีการสืบทอด
ค่าคงที่
สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME
ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow
วิธีการสาธารณะ
เอาท์พุท สาธารณะ < TFloat32 > asOutput ()
ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์
อินพุตสำหรับการดำเนินการ TensorFlow คือเอาต์พุตของการดำเนินการ TensorFlow อื่น วิธีการนี้ใช้เพื่อรับหมายเลขอ้างอิงสัญลักษณ์ที่แสดงถึงการคำนวณอินพุต
การสร้าง Mfcc แบบคงที่สาธารณะ (ขอบเขต ขอบเขต ตัวดำเนินการ < TFloat32 > สเปกโตรแกรม ตัวดำเนินการ < TInt32 > ตัวอย่างเรต ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ Mfcc ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|---|
สเปกโตรแกรม | โดยทั่วไปแล้วจะผลิตโดย Spectrogram op โดยตั้งค่า magnitude_squared ให้เป็นจริง |
อัตราตัวอย่าง | เสียงต้นฉบับที่ใช้มีตัวอย่างกี่ตัวอย่างต่อวินาที |
ตัวเลือก | มีค่าแอตทริบิวต์ทางเลือก |
การส่งคืน
- อินสแตนซ์ใหม่ของ Mfcc
Mfcc.Options สาธารณะคงที่ dctCoefficientCount (dctCoefficientCount แบบยาว)
พารามิเตอร์
dctค่าสัมประสิทธิ์การนับ | จำนวนช่องสัญญาณเอาท์พุตที่จะสร้างต่อการแบ่งเวลา |
---|
Mfcc.Options สาธารณะคง filterbankChannelCount (กรองยาว BankChannelCount)
พารามิเตอร์
filterbankChannelCount | ความละเอียดของธนาคาร Mel ที่ใช้ภายใน |
---|
Mfcc.Options คงที่สาธารณะ lowerFrequencyLimit (Float lowerFrequencyLimit)
พารามิเตอร์
ขีดจำกัดความถี่ที่ต่ำกว่า | ความถี่ต่ำสุดที่จะใช้เมื่อคำนวณ ceptstrum |
---|
Mfcc.Options คงที่สาธารณะ upperFrequencyLimit (Float upperFrequencyLimit)
พารามิเตอร์
ขีดจำกัดความถี่บน | ความถี่สูงสุดที่จะใช้เมื่อคำนวณ ceptstrum |
---|