FixedUnigramCandidateSampler.Options

فئة ثابتة عامة FixedUnigramCandidateSampler.Options

السمات الاختيارية لـ FixedUnigramCandidateSampler

الأساليب العامة

FixedUnigramCandidateSampler.Options
تشويه (تشويه تعويم)
FixedUnigramCandidateSampler.Options
numReservedIds (numReservedIds الطويلة)
FixedUnigramCandidateSampler.Options
numShards (numShards) طويلة
FixedUnigramCandidateSampler.Options
بذرة (بذور طويلة)
FixedUnigramCandidateSampler.Options
بذرة 2 (بذرة طويلة 2)
FixedUnigramCandidateSampler.Options
شظية (شظية طويلة)
FixedUnigramCandidateSampler.Options
unigrams (قائمة<Float> unigrams)
FixedUnigramCandidateSampler.Options
ملف vocab (ملف سلسلة vocab)

الطرق الموروثة

الأساليب العامة

تشويه FixedUnigramCandidateSampler.Options العام (تشويه التعويم)

حدود
تشوه يتم استخدام التشويه لتحريف توزيع احتمالية unigram. يتم رفع كل وزن أولاً إلى قوة التشويه قبل إضافته إلى توزيع الأحادي الداخلي. ونتيجة لذلك، فإن التشويه = 1.0 يعطي عينة منتظمة من أحادي جرام (كما هو محدد في ملف المفردات)، والتشويه = 0.0 يعطي توزيعًا موحدًا.

FixedUnigramCandidateSampler.Options العامة numReservedIds (Long numReservedIds)

حدود
numReservedIds اختياريًا، يمكن إضافة بعض المعرفات المحجوزة في النطاق [0، ...، num_reserved_ids) بواسطة المستخدمين. إحدى حالات الاستخدام هي أنه يتم استخدام رمز مميز لكلمة غير معروفة كمعرف 0. وسيكون لهذه المعرفات احتمالية أخذ العينات 0.

FixedUnigramCandidateSampler.Options العامة numShards (numShards طويلة)

حدود
numShards يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي. تشير هذه المعلمة (مع 'shard') إلى عدد الأقسام المستخدمة في الحساب الإجمالي.

بذور FixedUnigramCandidateSampler.Options العامة (بذور طويلة)

حدود
بذرة إذا تم تعيين البذرة أو البذرة 2 على قيمة غير صفرية، فسيتم تصنيف مولد الأرقام العشوائية بواسطة البذرة المعطاة. خلاف ذلك، يتم زرعها بواسطة بذرة عشوائية.

FixedUnigramCandidateSampler.Options العام بذرة 2 (بذرة طويلة 2)

حدود
البذور2 بذرة ثانية لتجنب اصطدام البذور.

جزء FixedUnigramCandidateSampler.Options العام (جزء طويل)

حدود
شظية يمكن استخدام أداة أخذ العينات لأخذ عينات من مجموعة فرعية من النطاق الأصلي من أجل تسريع العملية الحسابية بأكملها من خلال التوازي. تشير هذه المعلمة (مع 'num_shards') إلى رقم القسم المحدد لعملية أخذ العينات، عند استخدام التقسيم.

وحدات ثابتة FixedUnigramCandidateSampler.Options العامة (قائمة الوحدات الموحدة <Float>)

حدود
com.unigrams قائمة بأعداد أو احتمالات unigram، واحدة لكل معرف بترتيب تسلسلي. يجب تمرير واحد بالضبط من vocab_file وunigrams إلى هذا المرجع.

FixedUnigramCandidateSampler.Options العامة vocabFile (سلسلة vocabFile)

حدود
vocabFile كل سطر صالح في هذا الملف (الذي يجب أن يكون بتنسيق CSV) يتوافق مع معرف كلمة صالح. المعرفات مرتبة تسلسليًا، بدءًا من num_reserved_ids. من المتوقع أن يكون الإدخال الأخير في كل سطر قيمة مقابلة للعدد أو الاحتمال النسبي. يجب تمرير واحد بالضبط من vocab_file وunigrams إلى هذا المرجع.