aliran tensor:: operasi:: MemperbaikiUnigramCandidateSampler:: Attr
#include <candidate_sampling_ops.h>
Penyetel atribut opsional untuk FixedUnigramCandidateSampler .
Ringkasan
Atribut publik | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
Fungsi publik | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs Distorsi digunakan untuk mendistorsi distribusi probabilitas unigram. |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs Secara opsional, beberapa ID yang dicadangkan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna. |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme. |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs Jika salah satu seed atau seed2 disetel bukan nol, pembuat nomor acak akan diunggulkan oleh seed yang diberikan. |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs Benih kedua untuk menghindari benturan benih. |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme. |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan. |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs Setiap baris yang valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid. |
Atribut publik
distorsi_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
jumlah_id_yang dicadangkan_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
jumlah_pecahan_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
benih2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
benih_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
beling_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
unigram_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
kosakata_file_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
Fungsi publik
Distorsi
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
Distorsi digunakan untuk mendistorsi distribusi probabilitas unigram.
Setiap bobot pertama-tama dinaikkan ke kekuatan distorsi sebelum ditambahkan ke distribusi unigram internal. Hasilnya, distorsi = 1.0 memberikan pengambilan sampel unigram yang teratur (seperti yang ditentukan oleh file vocab), dan distorsi = 0.0 memberikan distribusi yang seragam.
Defaultnya adalah 1
JumlahReservedIds
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
Secara opsional, beberapa ID yang dicadangkan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna.
Salah satu kasus penggunaannya adalah token kata khusus yang tidak diketahui digunakan sebagai ID 0. ID ini akan memiliki probabilitas pengambilan sampel sebesar 0.
Defaultnya adalah 0
Nomor Pecahan
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme.
Parameter ini (bersama dengan 'shard') menunjukkan jumlah partisi yang digunakan dalam keseluruhan komputasi.
Defaultnya adalah 1
Benih
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
Jika salah satu seed atau seed2 disetel bukan nol, pembuat nomor acak akan diunggulkan oleh seed yang diberikan.
Jika tidak, ia akan diunggulkan dengan benih acak.
Defaultnya adalah 0
Benih2
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
Benih kedua untuk menghindari benturan benih.
Defaultnya adalah 0
Beling
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme.
Parameter ini (bersama dengan 'num_shards') menunjukkan nomor partisi tertentu dari operasi sampler, ketika partisi sedang digunakan.
Defaultnya adalah 0
Unigram
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan.
Tepatnya salah satu vocab_file dan unigram harus diteruskan ke operasi ini.
Defaultnya adalah []
File Kosakata
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
Setiap baris yang valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid.
ID disusun secara berurutan, dimulai dari num_reserved_ids. Entri terakhir di setiap baris diharapkan berupa nilai yang sesuai dengan hitungan atau probabilitas relatif. Tepatnya salah satu vocab_file dan unigram perlu diteruskan ke operasi ini.
Defaultnya adalah ""