टेंसरफ़्लो:: ऑप्स:: फिक्स्डयूनिग्रामकैंडिडेटसैंपलर:: Attrs
#include <candidate_sampling_ops.h>
फिक्स्डयूनिग्रामकैंडिडेटसैंपलर के लिए वैकल्पिक विशेषता सेटर्स।
सारांश
सार्वजनिक गुण | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
सार्वजनिक समारोह | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs विरूपण का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है। |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs वैकल्पिक रूप से उपयोगकर्ताओं द्वारा कुछ आरक्षित आईडी को [0, ..., num_reserved_ids) श्रेणी में जोड़ा जा सकता है। |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है। |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs यदि बीज या बीज 2 को गैर-शून्य पर सेट किया गया है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीजित किया जाता है। |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs बीज टकराव से बचने के लिए दूसरा बीज। |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है। |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs यूनीग्राम गणनाओं या संभावनाओं की एक सूची, क्रमिक क्रम में प्रति आईडी एक। |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs इस फ़ाइल में प्रत्येक मान्य पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है। |
सार्वजनिक गुण
विरूपण_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
संख्या_आरक्षित_आईडी_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
num_shards_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
बीज2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
बीज_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
ठीकरा_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
यूनीग्राम_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
vocab_file_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
सार्वजनिक समारोह
विरूपण
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
विरूपण का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है।
आंतरिक यूनीग्राम वितरण में जोड़ने से पहले प्रत्येक वजन को पहले विरूपण की शक्ति तक बढ़ाया जाता है। परिणामस्वरूप, विरूपण = 1.0 नियमित यूनीग्राम नमूना देता है (जैसा कि वोकैब फ़ाइल द्वारा परिभाषित किया गया है), और विरूपण = 0.0 एक समान वितरण देता है।
डिफ़ॉल्ट 1
संख्या आरक्षित आईडी
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
वैकल्पिक रूप से उपयोगकर्ताओं द्वारा कुछ आरक्षित आईडी को [0, ..., num_reserved_ids) श्रेणी में जोड़ा जा सकता है।
एक उपयोग मामला यह है कि एक विशेष अज्ञात शब्द टोकन का उपयोग आईडी 0 के रूप में किया जाता है। इन आईडी में 0 की नमूना संभावना होगी।
डिफ़ॉल्ट 0 है
न्यूशर्ड्स
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है।
यह पैरामीटर ('शार्क' के साथ) उन विभाजनों की संख्या को इंगित करता है जिनका उपयोग समग्र गणना में किया जा रहा है।
डिफ़ॉल्ट 1
बीज
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
यदि बीज या बीज 2 को गैर-शून्य पर सेट किया गया है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीजित किया जाता है।
अन्यथा, यह एक यादृच्छिक बीज द्वारा बोया जाता है।
डिफ़ॉल्ट 0 है
बीज2
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
बीज टकराव से बचने के लिए दूसरा बीज।
डिफ़ॉल्ट 0 है
ठीकरा
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
समांतरता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल श्रेणी के सबसेट से नमूना लेने के लिए एक सैंपलर का उपयोग किया जा सकता है।
यह पैरामीटर ('num_shards' के साथ) एक सैंपलर ऑप की विशेष विभाजन संख्या को इंगित करता है, जब विभाजन का उपयोग किया जा रहा हो।
डिफ़ॉल्ट 0 है
यूनीग्राम
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
यूनीग्राम गणनाओं या संभावनाओं की एक सूची, क्रमिक क्रम में प्रति आईडी एक।
वास्तव में vocab_file और unigrams में से एक को इस ऑप को पास किया जाना चाहिए।
डिफ़ॉल्ट रूप से []
वोकैबफ़ाइल
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
इस फ़ाइल में प्रत्येक मान्य पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है।
आईडी अनुक्रमिक क्रम में हैं, जो num_reserved_ids से शुरू होती हैं। प्रत्येक पंक्ति में अंतिम प्रविष्टि गिनती या सापेक्ष संभावना के अनुरूप मान होने की उम्मीद है। वास्तव में vocab_file और unigrams में से एक को इस ऑप में पास करने की आवश्यकता है।
डिफ़ॉल्ट रूप से ""