स्पेक्ट्रोग्राम को ऐसे रूप में परिवर्तित करता है जो वाक् पहचान के लिए उपयोगी हो।
मेल फ़्रीक्वेंसी सेप्स्ट्रल गुणांक ऑडियो डेटा का प्रतिनिधित्व करने का एक तरीका है जो मशीन लर्निंग के लिए एक इनपुट सुविधा के रूप में प्रभावी है। वे एक स्पेक्ट्रोग्राम (एक 'सेपस्ट्रम') के स्पेक्ट्रम को लेकर और कुछ उच्च आवृत्तियों को त्यागकर बनाए जाते हैं जो मानव कान के लिए कम महत्वपूर्ण हैं। वाक् पहचान की दुनिया में उनका एक लंबा इतिहास है, और अधिक जानने के लिए https://en.wikipedia.org/wiki/Mel-frequeency_cepstrum एक अच्छा संसाधन है।
नेस्टेड क्लासेस
कक्षा | एमएफसीसी.विकल्प | Mfcc के लिए वैकल्पिक विशेषताएँ |
स्थिरांक
डोरी | OP_NAME | इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है |
सार्वजनिक तरीके
आउटपुट < TFloat32 > | आउटपुट के रूप में () टेंसर का प्रतीकात्मक हैंडल लौटाता है। |
स्थिर एमएफसीसी | |
स्थिर एमएफसीसी.विकल्प | dctCoefficientCount (लंबा dctCoefficientCount) |
स्थिर एमएफसीसी.विकल्प | फ़िल्टरबैंकचैनलकाउंट (लंबा फ़िल्टरबैंकचैनलकाउंट) |
स्थिर एमएफसीसी.विकल्प | लोअरफ़्रीक्वेंसीलिमिट (फ़्लोट लोअरफ़्रीक्वेंसीलिमिट) |
आउटपुट < TFloat32 > | आउटपुट () |
स्थिर एमएफसीसी.विकल्प | अपरफ़्रीक्वेंसीलिमिट (फ्लोट अपरफ़्रीक्वेंसीलिमिट) |
विरासत में मिली विधियाँ
स्थिरांक
सार्वजनिक स्थैतिक अंतिम स्ट्रिंग OP_NAME
इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है
सार्वजनिक तरीके
सार्वजनिक आउटपुट < TFloat32 > asOutput ()
टेंसर का प्रतीकात्मक हैंडल लौटाता है।
TensorFlow संचालन के इनपुट किसी अन्य TensorFlow ऑपरेशन के आउटपुट हैं। इस पद्धति का उपयोग एक प्रतीकात्मक हैंडल प्राप्त करने के लिए किया जाता है जो इनपुट की गणना का प्रतिनिधित्व करता है।
सार्वजनिक स्थैतिक एमएफसीसी निर्माण ( स्कोप स्कोप, ऑपरेंड < TFloat32 > स्पेक्ट्रोग्राम, ऑपरेंड < TInt32 > नमूना दर, विकल्प... विकल्प)
एक नए एमएफसीसी ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
पैरामीटर
दायरा | वर्तमान दायरा |
---|---|
spectrogram | आमतौर पर स्पेक्ट्रोग्राम ऑप द्वारा निर्मित, परिमाण_वर्ग को सत्य पर सेट किया जाता है। |
नमूना दर | स्रोत ऑडियो ने प्रति सेकंड कितने नमूनों का उपयोग किया। |
विकल्प | वैकल्पिक गुण मान रखता है |
रिटर्न
- एमएफसीसी का एक नया उदाहरण
सार्वजनिक स्थैतिक Mfcc.Options dctCoefficientCount (लंबा dctCoefficientCount)
पैरामीटर
dctCoefficientCount | प्रति टाइम स्लाइस में कितने आउटपुट चैनल तैयार करने हैं। |
---|
सार्वजनिक स्थैतिक Mfcc.Options फ़िल्टरबैंकचैनलकाउंट (लंबा फ़िल्टरबैंकचैनलकाउंट)
पैरामीटर
फ़िल्टरबैंकचैनलकाउंट | मेल बैंक का रिज़ॉल्यूशन आंतरिक रूप से उपयोग किया जाता है। |
---|
सार्वजनिक स्थैतिक Mfcc.ऑप्शंस लोअरफ़्रीक्वेंसीलिमिट (फ़्लोट लोअरफ़्रीक्वेंसीलिमिट)
पैरामीटर
निचलीआवृत्तिसीमा | सेप्टस्ट्रम की गणना करते समय उपयोग की जाने वाली सबसे कम आवृत्ति। |
---|
सार्वजनिक स्थैतिक Mfcc.ऑप्शंस अपरफ़्रीक्वेंसीलिमिट (फ़्लोट अपरफ़्रीक्वेंसीलिमिट)
पैरामीटर
ऊपरीआवृत्तिसीमा | सेप्टस्ट्रम की गणना करते समय उपयोग की जाने वाली उच्चतम आवृत्ति। |
---|