AudioSummary

सार्वजनिक अंतिम कक्षा ऑडियोसारांश

ऑडियो के साथ एक `सारांश` प्रोटोकॉल बफ़र आउटपुट करता है।

सारांश में ऑडियो युक्त `max_outputs` सारांश मान तक हैं। ऑडियो `टेन्सर` से बनाया गया है जो `[बैच_आकार, फ्रेम, चैनल]` आकार के साथ 3-डी या `[बैच_आकार, फ्रेम]` आकार के साथ 2-डी होना चाहिए। मान `sample_rate` की नमूना दर के साथ `[-1.0, 1.0]` की सीमा में माने जाते हैं।

`टैग` तर्क `स्ट्रिंग` प्रकार का एक अदिश `टेन्सर` है। इसका उपयोग सारांश मानों का `टैग` बनाने के लिए किया जाता है:

  • यदि `max_outputs` 1 है, तो सारांश मान टैग ' टैग /ऑडियो' है।
  • यदि `max_outputs` 1 से अधिक है, तो सारांश मान टैग क्रमिक रूप से ' टैग /ऑडियो/0', ' टैग /ऑडियो/1', आदि के रूप में उत्पन्न होते हैं।

नेस्टेड क्लासेस

कक्षा ऑडियोसारांश.विकल्प AudioSummary के लिए वैकल्पिक विशेषताएँ

स्थिरांक

डोरी OP_NAME इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

सार्वजनिक तरीके

आउटपुट < TString >
आउटपुट के रूप में ()
टेंसर का प्रतीकात्मक हैंडल लौटाता है।
स्थिर ऑडियोसारांश
बनाएं ( स्कोप स्कोप, ऑपरेंड < TString > टैग, ऑपरेंड < TFloat32 > टेंसर, ऑपरेंड < TFloat32 > नमूना दर, विकल्प... विकल्प)
एक नया ऑडियोसमरी ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
स्थिर ऑडियोसारांश.विकल्प
अधिकतम आउटपुट (लंबे अधिकतम आउटपुट)
आउटपुट < TString >
सारांश ()
अदिश.

विरासत में मिली विधियाँ

स्थिरांक

सार्वजनिक स्थैतिक अंतिम स्ट्रिंग OP_NAME

इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

स्थिर मान: "ऑडियोसारांशV2"

सार्वजनिक तरीके

सार्वजनिक आउटपुट < TString > asOutput ()

टेंसर का प्रतीकात्मक हैंडल लौटाता है।

TensorFlow संचालन के इनपुट किसी अन्य TensorFlow ऑपरेशन के आउटपुट हैं। इस पद्धति का उपयोग एक प्रतीकात्मक हैंडल प्राप्त करने के लिए किया जाता है जो इनपुट की गणना का प्रतिनिधित्व करता है।

सार्वजनिक स्थैतिक ऑडियो सारांश बनाएं ( स्कोप स्कोप, ऑपरेंड < TString > टैग, ऑपरेंड < TFloat32 > टेंसर, ऑपरेंड < TFloat32 > नमूना दर, विकल्प... विकल्प)

एक नया ऑडियोसमरी ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।

पैरामीटर
दायरा वर्तमान दायरा
टैग अदिश. सारांश मानों की `टैग` विशेषता बनाने के लिए उपयोग किया जाता है।
टेन्सर आकार का 2-डी `[बैच_आकार, फ़्रेम]`।
नमूना दर हर्ट्ज़ में सिग्नल की नमूना दर.
विकल्प वैकल्पिक गुण मान रखता है
रिटर्न
  • AudioSummary का एक नया उदाहरण

सार्वजनिक स्थैतिक ऑडियोसारांश.विकल्प अधिकतमआउटपुट (लंबे अधिकतमआउटपुट)

पैरामीटर
अधिकतम आउटपुट ऑडियो उत्पन्न करने के लिए बैच तत्वों की अधिकतम संख्या।

सार्वजनिक आउटपुट < TString > सारांश ()

अदिश. क्रमबद्ध `सारांश` प्रोटोकॉल बफ़र।