جریان تنسور:: عملیات:: FixedUnigramCandidateSampler:: Attrs

#include <candidate_sampling_ops.h>

تنظیم کننده های ویژگی اختیاری برای FixedUnigramCandidateSampler .

خلاصه

صفات عمومی

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

توابع عمومی

Distortion (float x)
TF_MUST_USE_RESULT Attrs
اعوجاج برای انحراف توزیع احتمال یک گرم استفاده می شود.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
به صورت اختیاری، برخی از شناسه های رزرو شده را می توان در محدوده [0، ...، num_reserved_ids) توسط کاربران اضافه کرد.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
نمونه‌بردار را می‌توان برای نمونه‌برداری از زیر مجموعه‌ای از محدوده اصلی به منظور سرعت بخشیدن به کل محاسبات از طریق موازی‌سازی استفاده کرد.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
اگر seed یا seed2 غیر صفر باشد، مولد اعداد تصادفی توسط دانه داده شده بذر می شود.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
دانه دوم برای جلوگیری از برخورد دانه.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
نمونه‌بردار را می‌توان برای نمونه‌برداری از زیر مجموعه‌ای از محدوده اصلی به منظور سرعت بخشیدن به کل محاسبات از طریق موازی‌سازی استفاده کرد.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
فهرستی از تعداد یا احتمالات یونیگرام، یکی در هر شناسه به ترتیب متوالی.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
هر خط معتبر در این فایل (که باید قالبی شبیه CSV داشته باشد) با شناسه کلمه معتبر مطابقت دارد.

صفات عمومی

تحریف_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

دانه 2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

دانه_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

خرده_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

یونیگرم_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

توابع عمومی

تحریف

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

اعوجاج برای انحراف توزیع احتمال یک گرم استفاده می شود.

هر وزن ابتدا قبل از اضافه شدن به توزیع یونیگرم داخلی به قدرت اعوجاج افزایش می یابد. در نتیجه، اعوجاج = 1.0 نمونه گیری unigram منظم (همانطور که توسط فایل vocab تعریف شده است) و اعوجاج = 0.0 توزیع یکنواختی را ارائه می دهد.

پیش فرض 1 است

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

به صورت اختیاری، برخی از شناسه های رزرو شده را می توان در محدوده [0، ...، num_reserved_ids) توسط کاربران اضافه کرد.

یک مورد استفاده این است که یک رمز کلمه ناشناخته خاص به عنوان ID 0 استفاده می شود. این شناسه ها احتمال نمونه برداری 0 خواهند داشت.

پیش فرض 0 است

NumShards

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

نمونه‌بردار را می‌توان برای نمونه‌برداری از زیر مجموعه‌ای از محدوده اصلی به منظور سرعت بخشیدن به کل محاسبات از طریق موازی‌سازی استفاده کرد.

این پارامتر (همراه با 'shard') تعداد پارتیشن هایی را نشان می دهد که در محاسبات کلی استفاده می شوند.

پیش فرض 1 است

بذر

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

اگر seed یا seed2 غیر صفر باشد، مولد اعداد تصادفی توسط دانه داده شده بذر می شود.

در غیر این صورت، توسط یک بذر تصادفی بذر می شود.

پیش فرض 0 است

دانه 2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

دانه دوم برای جلوگیری از برخورد دانه.

پیش فرض 0 است

شارد

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

نمونه‌بردار را می‌توان برای نمونه‌برداری از زیر مجموعه‌ای از محدوده اصلی به منظور سرعت بخشیدن به کل محاسبات از طریق موازی‌سازی استفاده کرد.

این پارامتر (همراه با 'num_shards') شماره پارتیشن خاص یک نمونه کار را در هنگام استفاده از پارتیشن بندی نشان می دهد.

پیش فرض 0 است

Unigrams

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

فهرستی از تعداد یا احتمالات یونیگرام، یکی در هر شناسه به ترتیب متوالی.

دقیقاً یکی از vocab_file و unigram ها باید به این گزینه منتقل شود.

پیش‌فرض به []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

هر خط معتبر در این فایل (که باید قالبی شبیه CSV داشته باشد) با شناسه کلمه معتبر مطابقت دارد.

شناسه ها به ترتیب ترتیب هستند و از num_reserved_ids شروع می شوند. انتظار می رود آخرین ورودی در هر خط مقداری باشد که با تعداد یا احتمال نسبی مطابقت دارد. دقیقاً یکی از vocab_file و unigram ها باید به این گزینه منتقل شود.

پیش‌فرض به ""