tensorflow:: אופס:: FixedUnigramCandidateSampler:: Attrs
#include <candidate_sampling_ops.h>
קובעי תכונות אופציונליים עבור FixedUnigramCandidateSampler .
תַקצִיר
תכונות ציבוריות | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
תפקידים ציבוריים | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs העיוות משמש כדי להטות את התפלגות ההסתברות של אוניגרמה. |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs לחלופין, ניתן להוסיף כמה מזהים שמורים בטווח [0, ..., num_reserved_ids) על ידי המשתמשים. |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות. |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs אם ה-Seed או Seed2 מוגדרים לא-אפס, מחולל המספרים האקראיים מוזרע על ידי ה-Seed הנתון. |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs זרע שני כדי למנוע התנגשות זרע. |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות. |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs רשימה של ספירות או הסתברויות אוניגרמות, אחת לכל מזהה בסדר עוקב. |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs כל שורה חוקית בקובץ זה (שצריכה להיות בפורמט דמוי CSV) מתאימה לזיהוי מילה חוקי. |
תכונות ציבוריות
סַלְפָנוּת_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
num_reserved_ids_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
מספר_שברים_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
זרע2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
זֶרַע_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
חֶרֶס_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
unigrams_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
vocab_file_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
תפקידים ציבוריים
סַלְפָנוּת
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
העיוות משמש כדי להטות את התפלגות ההסתברות של אוניגרמה.
כל משקל מועלה תחילה לעוצמת העיוות לפני הוספת התפלגות האוניגרמה הפנימית. כתוצאה מכך, עיוות = 1.0 נותן דגימת אוניגרמה רגילה (כפי שהוגדר בקובץ ה-vocab), ועיוות = 0.0 נותן התפלגות אחידה.
ברירת המחדל היא 1
NumReservedIds
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
לחלופין, ניתן להוסיף כמה מזהים שמורים בטווח [0, ..., num_reserved_ids) על ידי המשתמשים.
מקרה שימוש אחד הוא שאסימון מיוחד של מילה לא ידוע משמש כמזהה 0. למזהים אלה תהיה הסתברות דגימה של 0.
ברירת המחדל היא 0
NumShards
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות.
פרמטר זה (יחד עם 'רסיס') מציין את מספר המחיצות שנמצאות בשימוש בחישוב הכולל.
ברירת המחדל היא 1
זֶרַע
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
אם ה-Seed או Seed2 מוגדרים לא-אפס, מחולל המספרים האקראיים מוזרע על ידי ה-Seed הנתון.
אחרת, הוא נזרע על ידי זרע אקראי.
ברירת המחדל היא 0
זרע 2
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
זרע שני כדי למנוע התנגשות זרע.
ברירת המחדל היא 0
חֶרֶס
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות.
פרמטר זה (יחד עם 'num_shards') מציין את מספר המחיצה המסוים של הפעלת דגימה, כאשר נעשה שימוש במחיצות.
ברירת המחדל היא 0
יוניגרמים
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
רשימה של ספירות או הסתברויות אוניגרמות, אחת לכל מזהה בסדר עוקב.
יש להעביר בדיוק אחד מ-vocab_file ו-unigrams לאופ הזה.
ברירת המחדל היא []
VocabFile
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
כל שורה חוקית בקובץ זה (שצריכה להיות בפורמט דמוי CSV) מתאימה לזיהוי מילה חוקי.
המזהים נמצאים בסדר עוקב, החל מ-num_reserved_ids. הערך האחרון בכל שורה צפוי להיות ערך המתאים לספירה או להסתברות יחסית. בדיוק אחד מ-vocab_file ו-unigrams צריך לעבור לאופ הזה.
ברירת המחדל היא ""
אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers. Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.
עדכון אחרון: 2024-11-24 (שעון UTC).