tensorflow:: אופס:: FixedUnigramCandidateSampler:: Attrs

#include <candidate_sampling_ops.h>

קובעי תכונות אופציונליים עבור FixedUnigramCandidateSampler .

תַקצִיר

תכונות ציבוריות

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

תפקידים ציבוריים

Distortion (float x)
TF_MUST_USE_RESULT Attrs
העיוות משמש כדי להטות את התפלגות ההסתברות של אוניגרמה.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
לחלופין, ניתן להוסיף כמה מזהים שמורים בטווח [0, ..., num_reserved_ids) על ידי המשתמשים.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
אם ה-Seed או Seed2 מוגדרים לא-אפס, מחולל המספרים האקראיים מוזרע על ידי ה-Seed הנתון.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
זרע שני כדי למנוע התנגשות זרע.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
רשימה של ספירות או הסתברויות אוניגרמות, אחת לכל מזהה בסדר עוקב.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
כל שורה חוקית בקובץ זה (שצריכה להיות בפורמט דמוי CSV) מתאימה לזיהוי מילה חוקי.

תכונות ציבוריות

סַלְפָנוּת_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

מספר_שברים_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

זרע2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

זֶרַע_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

חֶרֶס_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigrams_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

תפקידים ציבוריים

סַלְפָנוּת

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

העיוות משמש כדי להטות את התפלגות ההסתברות של אוניגרמה.

כל משקל מועלה תחילה לעוצמת העיוות לפני הוספת התפלגות האוניגרמה הפנימית. כתוצאה מכך, עיוות = 1.0 נותן דגימת אוניגרמה רגילה (כפי שהוגדר בקובץ ה-vocab), ועיוות = 0.0 נותן התפלגות אחידה.

ברירת המחדל היא 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

לחלופין, ניתן להוסיף כמה מזהים שמורים בטווח [0, ..., num_reserved_ids) על ידי המשתמשים.

מקרה שימוש אחד הוא שאסימון מיוחד של מילה לא ידוע משמש כמזהה 0. למזהים אלה תהיה הסתברות דגימה של 0.

ברירת המחדל היא 0

NumShards

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות.

פרמטר זה (יחד עם 'רסיס') מציין את מספר המחיצות שנמצאות בשימוש בחישוב הכולל.

ברירת המחדל היא 1

זֶרַע

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

אם ה-Seed או Seed2 מוגדרים לא-אפס, מחולל המספרים האקראיים מוזרע על ידי ה-Seed הנתון.

אחרת, הוא נזרע על ידי זרע אקראי.

ברירת המחדל היא 0

זרע 2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

זרע שני כדי למנוע התנגשות זרע.

ברירת המחדל היא 0

חֶרֶס

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

ניתן להשתמש בדמפלר כדי לדגום מתת-קבוצה של הטווח המקורי על מנת לזרז את כל החישוב באמצעות מקביליות.

פרמטר זה (יחד עם 'num_shards') מציין את מספר המחיצה המסוים של הפעלת דגימה, כאשר נעשה שימוש במחיצות.

ברירת המחדל היא 0

יוניגרמים

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

רשימה של ספירות או הסתברויות אוניגרמות, אחת לכל מזהה בסדר עוקב.

בדיוק אחד מ-vocab_file ו-unigrams צריך לעבור לאופ הזה.

ברירת המחדל היא []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

כל שורה חוקית בקובץ זה (שצריכה להיות בפורמט דמוי CSV) מתאימה לזיהוי מילה חוקי.

המזהים נמצאים בסדר עוקב, החל מ-num_reserved_ids. הערך האחרון בכל שורה צפוי להיות ערך המתאים לספירה או להסתברות יחסית. בדיוק אחד מ-vocab_file ו-unigrams צריך לעבור לאופ הזה.

ברירת המחדל היא ""