يُنشئ تسميات لأخذ العينات المرشحة بتوزيع موحد.
راجع شروحات أخذ عينات المرشحين وتنسيقات البيانات على go/candidate-sampling.
لكل دفعة، تختار هذه العملية مجموعة واحدة من عينات التسميات المرشحة.
تتمثل مزايا أخذ عينات المرشحين لكل دفعة في البساطة وإمكانية مضاعفة المصفوفة الكثيفة بكفاءة. والعيب هو أنه يجب اختيار المرشحين في العينة بشكل مستقل عن السياق وعن التسميات الحقيقية.
فئات متداخلة
فصل | UniCandidateSampler.Options | السمات الاختيارية لـ UniformCandidateSampler |
الثوابت
خيط | OP_NAME | اسم هذه العملية كما هو معروف بواسطة محرك TensorFlow الأساسي |
الأساليب العامة
ثابت الزي الموحد CandidateSampler | إنشاء (نطاق النطاق ، المعامل < TInt64 > trueClasses، Long numTrue، Long numSampled، Boolean Unique، Long rangeMax، Options... options) طريقة المصنع لإنشاء فئة تغلف عملية موحدة CandidateSampler جديدة. |
الإخراج <TInt64> | المرشحين الذين تم أخذ عينات منهم () متجه بطول num_sampled، حيث يكون كل عنصر هو معرف المرشح الذي تم أخذ عينات منه. |
الإخراج <TFloat32> | سامبليدبكتيدكونت () متجه بطول num_sampled، لكل مرشح تم أخذ عينات منه يمثل عدد المرات التي من المتوقع أن يظهر فيها المرشح في مجموعة من المرشحين الذين تم أخذ عينات منهم. |
ثابت منتظم CandidateSampler.Options | بذرة (بذور طويلة) |
ثابت منتظم CandidateSampler.Options | بذرة 2 (بذرة طويلة 2) |
الإخراج <TFloat32> | العدد الحقيقي المتوقع () مصفوفة Batch_size * num_true، تمثل عدد المرات التي من المتوقع أن يحدث فيها كل مرشح في مجموعة من المرشحين الذين تم أخذ عينات منهم. |
الطرق الموروثة
الثوابت
السلسلة النهائية الثابتة العامة OP_NAME
اسم هذه العملية كما هو معروف بواسطة محرك TensorFlow الأساسي
الأساليب العامة
إنشاء نموذج منتظم ثابت عام ( نطاق النطاق ، المعامل < TInt64 > trueClasses، Long numTrue، Long numSampled، Boolean Unique، Long rangeMax، Options... options)
طريقة المصنع لإنشاء فئة تغلف عملية موحدة CandidateSampler جديدة.
حدود
نِطَاق | النطاق الحالي |
---|---|
trueClasses | مصفوفة Batch_size * num_true، حيث يحتوي كل صف على معرفات num_true target_classes في التسمية الأصلية المقابلة. |
numTrue | عدد التسميات الحقيقية لكل سياق. |
numSampled | عدد المرشحين للعينة العشوائية |
فريد | إذا كان فريدًا صحيحًا، فإننا نأخذ عينة مع الرفض، بحيث يكون جميع المرشحين الذين تم أخذ عينات منهم في الدفعة فريدين. ويتطلب ذلك بعض التقريب لتقدير احتمالات أخذ العينات بعد الرفض. |
rangeMax | سيقوم جهاز أخذ العينات بأخذ عينات من الأعداد الصحيحة من الفاصل الزمني [0، range_max). |
خيارات | يحمل قيم السمات الاختيارية |
عائدات
- مثيل جديد من UniCandidateSampler
الإخراج العام <TInt64> عينات المرشحين ()
متجه بطول num_sampled، حيث يكون كل عنصر هو معرف المرشح الذي تم أخذ عينات منه.
الإخراج العام <TFloat32> SampledExpectedCount ()
متجه بطول num_sampled، لكل مرشح تم أخذ عينات منه يمثل عدد المرات التي من المتوقع أن يظهر فيها المرشح في مجموعة من المرشحين الذين تم أخذ عينات منهم. إذا كان فريدًا = صحيح، فهذا احتمال.
البذور الثابتة العامة الموحدة CandidateSampler.Options (البذرة الطويلة)
حدود
بذرة | إذا تم تعيين البذرة أو البذرة 2 على قيمة غير صفرية، فسيتم تصنيف مولد الأرقام العشوائية بواسطة البذرة المعطاة. خلاف ذلك، يتم زرعها بواسطة بذرة عشوائية. |
---|
ثابت عام الموحدة CandidateSampler.Options بذرة 2 (بذرة طويلة 2)
حدود
البذور2 | بذرة ثانية لتجنب اصطدام البذور. |
---|
الإخراج العام <TFloat32> trueExpectedCount ()
مصفوفة Batch_size * num_true، تمثل عدد المرات التي من المتوقع أن يحدث فيها كل مرشح في مجموعة من المرشحين الذين تم أخذ عينات منهم. إذا كان فريدًا = صحيح، فهذا احتمال.