tensor akışı:: işlem:: SabitUnigramCandidateSampler:: Öznitelikler

#include <candidate_sampling_ops.h>

FixUnigramCandidateSampler için isteğe bağlı öznitelik ayarlayıcılar.

Özet

Genel özellikler

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

Kamu işlevleri

Distortion (float x)
TF_MUST_USE_RESULT Attrs
Distorsiyon, unigram olasılık dağılımını çarpıtmak için kullanılır.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
İsteğe bağlı olarak kullanıcılar tarafından [0, ..., num_reserved_ids) aralığında bazı ayrılmış ID'ler eklenebilir.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Tohum veya tohum2 sıfırdan farklı bir değere ayarlanmışsa, rastgele sayı üreteci verilen tohum tarafından tohumlanır.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
Tohum çarpışmasını önlemek için ikinci bir tohum.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
Unigram sayımlarının veya olasılıklarının, kimlik başına bir sıralı sırayla listesi.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
Bu dosyadaki (CSV benzeri bir formata sahip olması gereken) her geçerli satır, geçerli bir kelime kimliğine karşılık gelir.

Genel özellikler

çarpıtma_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

tohum2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

tohum_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

kırık_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigramlar_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

kelime_dosyası_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Kamu işlevleri

Çarpıtma

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

Distorsiyon, unigram olasılık dağılımını çarpıtmak için kullanılır.

Her ağırlık, dahili unigram dağılımına eklenmeden önce ilk olarak distorsiyonun gücüne yükseltilir. Sonuç olarak, distorsiyon = 1,0, düzenli unigram örneklemeyi verir (vocab dosyası tarafından tanımlandığı gibi) ve distorsiyon = 0,0, düzgün bir dağılım verir.

Varsayılan 1'dir

Ayrılmış Kimlik Sayısı

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

İsteğe bağlı olarak kullanıcılar tarafından [0, ..., num_reserved_ids) aralığında bazı ayrılmış ID'ler eklenebilir.

Bir kullanım durumu, özel bir bilinmeyen kelime belirtecinin ID 0 olarak kullanılmasıdır. Bu ID'lerin örnekleme olasılığı 0 olacaktır.

Varsayılanlar 0'dır

Parça Sayısı

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir.

Bu parametre ('shard' ile birlikte) genel hesaplamada kullanılan bölüm sayısını gösterir.

Varsayılan 1'dir

Tohum

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Tohum veya tohum2 sıfırdan farklı bir değere ayarlanmışsa, rastgele sayı üreteci verilen tohum tarafından tohumlanır.

Aksi takdirde rastgele bir tohumla tohumlanır.

Varsayılanlar 0'dır

Tohum2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Tohum çarpışmasını önlemek için ikinci bir tohum.

Varsayılanlar 0'dır

Parça

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir.

Bu parametre ('num_shards' ile birlikte), bölümleme kullanıldığında bir örnekleyici işleminin belirli bölüm numarasını gösterir.

Varsayılanlar 0'dır

Unigramlar

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Unigram sayımlarının veya olasılıklarının, kimlik başına sıralı bir şekilde bir listesi.

Bu operasyona vocab_file ve unigramlardan tam olarak biri aktarılmalıdır.

Varsayılan olarak []

Kelime Dosyası

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

Bu dosyadaki (CSV benzeri bir formata sahip olması gereken) her geçerli satır, geçerli bir kelime kimliğine karşılık gelir.

Kimlikler num_reserved_ids'den başlayarak sıralıdır. Her satırdaki son girişin sayıma veya bağıl olasılığa karşılık gelen bir değer olması beklenir. Bu operasyona vocab_file ve unigramlardan tam olarak birinin aktarılması gerekiyor.

Varsayılan olarak ""