नई और पुरानी शब्दावली फ़ाइलों के लिए एक पथ देखते हुए, एक रीमैपिंग टेंसर लौटाता है
लंबाई `num_new_vocab`, जहां `रीमैपिंग[i]` में पुरानी शब्दावली में पंक्ति संख्या शामिल है जो नई शब्दावली में पंक्ति `i` से मेल खाती है (लाइन `new_vocab_offset` से शुरू होकर `num_new_vocab` इकाइयों तक), या `- 1` यदि नई शब्दावली में प्रविष्टि `i` पुरानी शब्दावली में नहीं है। यदि `old_vocab_size` -1 का डिफ़ॉल्ट मान नहीं है, तो पुरानी शब्दावली पहली `old_vocab_size` प्रविष्टियों तक सीमित है।
`num_vocab_offset` विभाजित चर मामले में उपयोग को सक्षम बनाता है, और आम तौर पर विभाजन जानकारी की जांच के माध्यम से सेट किया जाना चाहिए। फ़ाइलों का प्रारूप एक टेक्स्ट फ़ाइल होना चाहिए, जिसमें प्रत्येक पंक्ति में शब्दावली के भीतर एक इकाई शामिल होनी चाहिए।
उदाहरण के लिए, `new_vocab_file` के साथ एक टेक्स्ट फ़ाइल जिसमें एक पंक्ति में निम्नलिखित प्रत्येक तत्व शामिल हैं: `[f0, f1, f2, f3]`, Old_vocab_file = [f1, f0, f3], `num_new_vocab = 3, new_vocab_offset = 1`, लौटाई गई रीमैपिंग `[0, -1, 2]` होगी।
ऑप यह गिनती भी लौटाता है कि नई शब्दावली में पुरानी शब्दावली में कितनी प्रविष्टियाँ मौजूद थीं, जिसका उपयोग वेट मैट्रिक्स रीमैपिंग में आरंभ करने के लिए मानों की संख्या की गणना करने के लिए किया जाता है।
इस कार्यक्षमता का उपयोग TensorFlow चौकियों से पंक्ति शब्दावली (आमतौर पर, सुविधाएँ) और स्तंभ शब्दावली (आमतौर पर, कक्षाएं) दोनों को रीमैप करने के लिए किया जा सकता है। ध्यान दें कि विभाजन तर्क विभाजन-विभाजित चर के अनुरूप सन्निहित शब्दावलियों पर निर्भर करता है। इसके अलावा, अंतर्निहित रीमैपिंग एक IndexTable (एक सटीक CuckooTable के विपरीत) का उपयोग करती है, इसलिए क्लाइंट कोड को संबंधित Index_table_from_file() का उपयोग करना चाहिए जैसा कि फ़ीचरकॉलम फ्रेमवर्क करता है (tf.feature_to_id() के विपरीत, जो एक CuckooTable का उपयोग करता है)।
नेस्टेड क्लासेस
कक्षा | वोकैब रीमैपिंग विकल्प जेनरेट करें | GenerateVocabRemapping के लिए वैकल्पिक विशेषताएँ |
स्थिरांक
डोरी | OP_NAME | इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है |
सार्वजनिक तरीके
स्टेटिक जेनरेट वोकैब रीमैपिंग | |
आउटपुट <TInt32> | संख्यावर्तमान () पुरानी शब्दावली में पाई गई नई शब्दावली प्रविष्टियों की संख्या। |
स्थैतिक जनरेट वोकैब रीमैपिंग.विकल्प | पुरानावोकैबआकार (लंबा पुरानावोकैबआकार) |
आउटपुट <TInt64> | रीमैपिंग () लंबाई का एक टेंसर num_new_vocab जहां सूचकांक i पर तत्व पुरानी आईडी के बराबर है जो नई आईडी i पर मैप करता है। |
विरासत में मिली विधियाँ
स्थिरांक
सार्वजनिक स्थैतिक अंतिम स्ट्रिंग OP_NAME
इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है
सार्वजनिक तरीके
सार्वजनिक स्थैतिक जेनरेट वोकैब रीमैपिंग बनाएं ( स्कोप स्कोप, ऑपरेंड < TString > newVocabFile, ऑपरेंड < TString > OldVocabFile, लंबा newVocabOffset, लंबा numNewVocab, विकल्प... विकल्प)
एक नया जेनरेटवोकैब रीमैपिंग ऑपरेशन लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
पैरामीटर
दायरा | वर्तमान दायरा |
---|---|
newVocabफ़ाइल | नई वोकैब फ़ाइल का पथ. |
OldVocabफ़ाइल | पुरानी वोकैब फ़ाइल का पथ. |
newVocabOffset | पढ़ना शुरू करने के लिए नई वोकैब फ़ाइल में कितनी प्रविष्टियाँ हैं। |
numNewVocab | रीमैप करने के लिए नई वोकैब फ़ाइल में प्रविष्टियों की संख्या। |
विकल्प | वैकल्पिक गुण मान रखता है |
रिटर्न
- GenerateVocabRemapping का एक नया उदाहरण
सार्वजनिक आउटपुट <TInt32> numPresent ()
पुरानी शब्दावली में पाई गई नई शब्दावली प्रविष्टियों की संख्या।
सार्वजनिक स्थैतिक जेनरेट वोकैब रीमैपिंग. विकल्प पुराना वोकैब आकार (लंबा पुराना वोकैब आकार)
पैरामीटर
OldVocabSize | विचार करने के लिए पुरानी शब्दावली फ़ाइल में प्रविष्टियों की संख्या। यदि -1, तो संपूर्ण पुरानी शब्दावली का उपयोग करें। |
---|