تدفق التوتر:: العمليات:: ثابتUnigramCandidateSampler:: أترز

#include <candidate_sampling_ops.h>

محددات السمات الاختيارية لـ FixedUnigramCandidateSampler .

ملخص

الصفات العامة

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

الوظائف العامة

Distortion (float x)
TF_MUST_USE_RESULT Attrs
يتم استخدام التشويه لتحريف توزيع احتمالية unigram.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
اختياريًا، يمكن إضافة بعض المعرفات المحجوزة في النطاق [0، ...، num_reserved_ids) بواسطة المستخدمين.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
إذا تم تعيين البذرة أو البذرة 2 على قيمة غير صفرية، فسيتم تصنيف مولد الأرقام العشوائية بواسطة البذرة المعطاة.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
بذرة ثانية لتجنب اصطدام البذور.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
قائمة بأعداد أو احتمالات unigram، واحدة لكل معرف بترتيب تسلسلي.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
كل سطر صالح في هذا الملف (الذي يجب أن يكون بتنسيق CSV) يتوافق مع معرف كلمة صالح.

الصفات العامة

تشويه_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

بذرة2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

بذرة_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

قشرة_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

يونيجرام_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

الوظائف العامة

تشويه

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

يتم استخدام التشويه لتحريف توزيع احتمالية unigram.

يتم رفع كل وزن أولاً إلى قوة التشويه قبل إضافته إلى توزيع الأحادي الداخلي. ونتيجة لذلك، فإن التشويه = 1.0 يعطي عينة منتظمة من أحادي جرام (كما هو محدد في ملف المفردات)، والتشويه = 0.0 يعطي توزيعًا موحدًا.

الإعدادات الافتراضية إلى 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

اختياريًا، يمكن إضافة بعض المعرفات المحجوزة في النطاق [0، ...، num_reserved_ids) بواسطة المستخدمين.

إحدى حالات الاستخدام هي أنه يتم استخدام رمز مميز لكلمة غير معروفة كمعرف 0. سيكون لهذه المعرفات احتمالية أخذ العينات 0.

الإعدادات الافتراضية إلى 0

نومشاردز

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي.

تشير هذه المعلمة (مع 'shard') إلى عدد الأقسام المستخدمة في الحساب الإجمالي.

الإعدادات الافتراضية إلى 1

بذرة

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

إذا تم تعيين البذرة أو البذرة 2 على قيمة غير صفرية، فسيتم تصنيف مولد الأرقام العشوائية بواسطة البذرة المعطاة.

خلاف ذلك، يتم زرعها بواسطة بذرة عشوائية.

الإعدادات الافتراضية إلى 0

البذور2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

بذرة ثانية لتجنب اصطدام البذور.

الإعدادات الافتراضية إلى 0

قشرة

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي.

تشير هذه المعلمة (مع 'num_shards') إلى رقم القسم المحدد لعملية أخذ العينات، عند استخدام التقسيم.

الإعدادات الافتراضية إلى 0

يونيجرامز

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

قائمة بأعداد أو احتمالات unigram، واحدة لكل معرف بترتيب تسلسلي.

يجب تمرير واحد بالضبط من vocab_file وunigrams إلى هذا المرجع.

الإعدادات الافتراضية إلى []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

كل سطر صالح في هذا الملف (الذي يجب أن يكون بتنسيق CSV) يتوافق مع معرف كلمة صالح.

المعرفات مرتبة تسلسليًا، بدءًا من num_reserved_ids. من المتوقع أن يكون الإدخال الأخير في كل سطر قيمة مقابلة للعدد أو الاحتمال النسبي. يجب تمرير واحد بالضبط من vocab_file وunigrams إلى هذا المرجع.

الإعدادات الافتراضية إلى ""