tensor akışı:: işlem:: SabitUnigramCandidateSampler:: Öznitelikler
#include <candidate_sampling_ops.h>
FixUnigramCandidateSampler için isteğe bağlı öznitelik ayarlayıcılar.
Özet
Genel özellikler | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
Kamu işlevleri | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs Distorsiyon, unigram olasılık dağılımını çarpıtmak için kullanılır. |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs İsteğe bağlı olarak kullanıcılar tarafından [0, ..., num_reserved_ids) aralığında bazı ayrılmış ID'ler eklenebilir. |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir. |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs Tohum veya tohum2 sıfırdan farklı bir değere ayarlanmışsa, rastgele sayı üreteci verilen tohum tarafından tohumlanır. |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs Tohum çarpışmasını önlemek için ikinci bir tohum. |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir. |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs Unigram sayımlarının veya olasılıklarının, kimlik başına sıralı bir şekilde bir listesi. |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs Bu dosyadaki (CSV benzeri bir formata sahip olması gereken) her geçerli satır, geçerli bir kelime kimliğine karşılık gelir. |
Genel özellikler
çarpıtma_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
num_reserved_ids_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
num_shards_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
tohum2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
tohum_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
kırık_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
unigramlar_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
kelime_dosyası_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
Kamu işlevleri
Çarpıtma
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
Distorsiyon, unigram olasılık dağılımını çarpıtmak için kullanılır.
Her ağırlık, dahili unigram dağılımına eklenmeden önce ilk olarak distorsiyonun gücüne yükseltilir. Sonuç olarak, distorsiyon = 1,0, düzenli unigram örneklemeyi (kelime dosyası tarafından tanımlandığı gibi) verir ve distorsiyon = 0,0, düzgün bir dağılım verir.
Varsayılan 1'dir
Ayrılmış Kimlik Sayısı
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
İsteğe bağlı olarak kullanıcılar tarafından [0, ..., num_reserved_ids) aralığında bazı ayrılmış ID'ler eklenebilir.
Bir kullanım durumu, özel bir bilinmeyen kelime belirtecinin ID 0 olarak kullanılmasıdır. Bu ID'lerin örnekleme olasılığı 0 olacaktır.
Varsayılanlar 0'dır
Parça Sayısı
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir.
Bu parametre ('shard' ile birlikte) genel hesaplamada kullanılan bölüm sayısını gösterir.
Varsayılan 1'dir
Tohum
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
Tohum veya tohum2 sıfırdan farklı bir değere ayarlanmışsa, rastgele sayı üreteci verilen tohum tarafından tohumlanır.
Aksi halde rastgele bir tohumla tohumlanır.
Varsayılanlar 0'dır
Tohum2
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
Tohum çarpışmasını önlemek için ikinci bir tohum.
Varsayılanlar 0'dır
Parça
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir.
Bu parametre ('num_shards' ile birlikte), bölümleme kullanıldığında bir örnekleyici işleminin belirli bölüm numarasını gösterir.
Varsayılanlar 0'dır
Unigramlar
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
Unigram sayımlarının veya olasılıklarının, kimlik başına sıralı bir şekilde bir listesi.
Bu operasyona vocab_file ve unigramlardan tam olarak biri aktarılmalıdır.
Varsayılan olarak []
Kelime Dosyası
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
Bu dosyadaki (CSV benzeri bir formata sahip olması gereken) her geçerli satır, geçerli bir kelime kimliğine karşılık gelir.
Kimlikler num_reserved_ids'den başlayarak sıralıdır. Her satırdaki son girişin sayıma veya bağıl olasılığa karşılık gelen bir değer olması beklenir. Bu operasyona vocab_file ve unigramlardan tam olarak birinin aktarılması gerekiyor.
Varsayılan olarak ""