FixedUnigramCandidateSampler.Options

מחלקה סטטית ציבורית FixedUnigramCandidateSampler.Options

תכונות אופציונליות עבור FixedUnigramCandidateSampler

שיטות ציבוריות

FixedUnigramCandidateSampler.Options
עיוות (עיוות צף)
FixedUnigramCandidateSampler.Options
numReservedIds (Long numReservedIds)
FixedUnigramCandidateSampler.Options
numShards (Long numShards)
FixedUnigramCandidateSampler.Options
זרע (זרע ארוך)
FixedUnigramCandidateSampler.Options
seed2 (זרע ארוך2)
FixedUnigramCandidateSampler.Options
רסיס (רסיס ארוך)
FixedUnigramCandidateSampler.Options
unigrams (רשימה<Float> unigrams)
FixedUnigramCandidateSampler.Options
vocabFile (מחרוזת vocabFile)

שיטות בירושה

שיטות ציבוריות

public FixedUnigramCandidateSampler. עיוות אפשרויות (עיוות צף)

פרמטרים
עיוות העיוות משמש כדי להטות את התפלגות ההסתברות של אוניגרמה. כל משקל מועלה תחילה לעוצמת העיוות לפני הוספת התפלגות האוניגרמה הפנימית. כתוצאה מכך, עיוות = 1.0 נותן דגימת אוניגרמה רגילה (כפי שהוגדר בקובץ ה-vocab), ועיוות = 0.0 נותן התפלגות אחידה.

public FixedUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)

פרמטרים
numReservedIds לחלופין, ניתן להוסיף כמה מזהים שמורים בטווח [0, ..., num_reserved_ids) על ידי המשתמשים. מקרה שימוש אחד הוא שאסימון מיוחד של מילה לא ידוע משמש כמזהה 0. למזהים אלה תהיה הסתברות דגימה של 0.

public FixedUnigramCandidateSampler.Options numShards (Long numShards)

פרמטרים
numShards ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות. פרמטר זה (יחד עם 'רסיס') מציין את מספר המחיצות שנמצאות בשימוש בחישוב הכולל.

public FixedUnigramCandidateSampler.Seed אפשרויות (סיד ארוך)

פרמטרים
זֶרַע אם ה-seed או seed2 מוגדרים לא-אפס, מחולל המספרים האקראיים מוזרע על ידי ה-seed הנתון. אחרת, הוא נזרע על ידי זרע אקראי.

public FixedUnigramCandidateSampler.Options seed2 (Long seed2)

פרמטרים
זרע 2 זרע שני כדי למנוע התנגשות זרע.

public FixedUnigramCandidateSampler. קטע אפשרויות (רסיס ארוך)

פרמטרים
חֶרֶס ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות. פרמטר זה (יחד עם 'num_shards') מציין את מספר המחיצה המסוים של הפעלת דגימה, כאשר נעשה שימוש במחיצות.

public FixedUnigramCandidateSampler.Options unigrams (List<Float> unigrams)

פרמטרים
אוניגרמים רשימה של ספירות או הסתברויות אוניגרמות, אחת לכל מזהה בסדר עוקב. בדיוק אחד מ-vocab_file ו-unigrams צריך לעבור לאופ הזה.

public FixedUnigramCandidateSampler.Options vocabFile (String vocabFile)

פרמטרים
vocabFile כל שורה חוקית בקובץ זה (שצריכה להיות בפורמט דמוי CSV) מתאימה לזיהוי מילה חוקי. המזהים נמצאים בסדר עוקב, החל מ-num_reserved_ids. הערך האחרון בכל שורה צפוי להיות ערך המתאים לספירה או להסתברות יחסית. בדיוק אחד מ-vocab_file ו-unigrams צריך לעבור לאופ הזה.