מחלקה סטטית ציבורית FixedUnigramCandidateSampler.Options
תכונות אופציונליות עבור FixedUnigramCandidateSampler
שיטות ציבוריות
FixedUnigramCandidateSampler.Options | עיוות (עיוות צף) |
FixedUnigramCandidateSampler.Options | numReservedIds (Long numReservedIds) |
FixedUnigramCandidateSampler.Options | numShards (Long numShards) |
FixedUnigramCandidateSampler.Options | זרע (זרע ארוך) |
FixedUnigramCandidateSampler.Options | seed2 (זרע ארוך2) |
FixedUnigramCandidateSampler.Options | רסיס (רסיס ארוך) |
FixedUnigramCandidateSampler.Options | unigrams (רשימה<Float> unigrams) |
FixedUnigramCandidateSampler.Options | vocabFile (מחרוזת vocabFile) |
שיטות בירושה
שיטות ציבוריות
public FixedUnigramCandidateSampler. עיוות אפשרויות (עיוות צף)
פרמטרים
עיוות | העיוות משמש כדי להטות את התפלגות ההסתברות של אוניגרמה. כל משקל מועלה תחילה לעוצמת העיוות לפני הוספת התפלגות האוניגרמה הפנימית. כתוצאה מכך, עיוות = 1.0 נותן דגימת אוניגרמה רגילה (כפי שהוגדר בקובץ ה-vocab), ועיוות = 0.0 נותן התפלגות אחידה. |
---|
public FixedUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)
פרמטרים
numReservedIds | לחלופין, ניתן להוסיף כמה מזהים שמורים בטווח [0, ..., num_reserved_ids) על ידי המשתמשים. מקרה שימוש אחד הוא שאסימון מיוחד של מילה לא ידוע משמש כמזהה 0. למזהים אלה תהיה הסתברות דגימה של 0. |
---|
public FixedUnigramCandidateSampler.Options numShards (Long numShards)
פרמטרים
numShards | ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות. פרמטר זה (יחד עם 'רסיס') מציין את מספר המחיצות שנמצאות בשימוש בחישוב הכולל. |
---|
public FixedUnigramCandidateSampler.Seed אפשרויות (סיד ארוך)
פרמטרים
זֶרַע | אם ה-seed או seed2 מוגדרים לא-אפס, מחולל המספרים האקראיים מוזרע על ידי ה-seed הנתון. אחרת, הוא נזרע על ידי זרע אקראי. |
---|
public FixedUnigramCandidateSampler.Options seed2 (Long seed2)
פרמטרים
זרע 2 | זרע שני כדי למנוע התנגשות זרע. |
---|
public FixedUnigramCandidateSampler. קטע אפשרויות (רסיס ארוך)
פרמטרים
חֶרֶס | ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות. פרמטר זה (יחד עם 'num_shards') מציין את מספר המחיצה המסוים של הפעלת דגימה, כאשר נעשה שימוש במחיצות. |
---|
public FixedUnigramCandidateSampler.Options unigrams (List<Float> unigrams)
פרמטרים
אוניגרמים | רשימה של ספירות או הסתברויות אוניגרמות, אחת לכל מזהה בסדר עוקב. בדיוק אחד מ-vocab_file ו-unigrams צריך לעבור לאופ הזה. |
---|
public FixedUnigramCandidateSampler.Options vocabFile (String vocabFile)
פרמטרים
vocabFile | כל שורה חוקית בקובץ זה (שצריכה להיות בפורמט דמוי CSV) מתאימה לזיהוי מילה חוקי. המזהים נמצאים בסדר עוקב, החל מ-num_reserved_ids. הערך האחרון בכל שורה צפוי להיות ערך המתאים לספירה או להסתברות יחסית. בדיוק אחד מ-vocab_file ו-unigrams צריך לעבור לאופ הזה. |
---|