aliran tensor:: operasi:: MemperbaikiUnigramCandidateSampler:: Attr

#include <candidate_sampling_ops.h>

Penyetel atribut opsional untuk FixedUnigramCandidateSampler .

Ringkasan

Atribut publik

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

Fungsi publik

Distortion (float x)
TF_MUST_USE_RESULT Attrs
Distorsi digunakan untuk mendistorsi distribusi probabilitas unigram.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
Secara opsional, beberapa ID yang dicadangkan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Jika salah satu seed atau seed2 disetel bukan nol, pembuat nomor acak akan diunggulkan oleh seed yang diberikan.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
Benih kedua untuk menghindari benturan benih.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
Setiap baris yang valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid.

Atribut publik

distorsi_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

jumlah_id_yang dicadangkan_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

jumlah_pecahan_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

benih2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

benih_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

beling_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigram_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

kosakata_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Fungsi publik

Distorsi

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

Distorsi digunakan untuk mendistorsi distribusi probabilitas unigram.

Setiap bobot pertama-tama dinaikkan ke kekuatan distorsi sebelum ditambahkan ke distribusi unigram internal. Hasilnya, distorsi = 1.0 memberikan pengambilan sampel unigram yang teratur (seperti yang ditentukan oleh file vocab), dan distorsi = 0.0 memberikan distribusi yang seragam.

Defaultnya adalah 1

JumlahReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

Secara opsional, beberapa ID yang dicadangkan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna.

Salah satu kasus penggunaannya adalah token kata khusus yang tidak diketahui digunakan sebagai ID 0. ID ini akan memiliki probabilitas pengambilan sampel sebesar 0.

Defaultnya adalah 0

Nomor Pecahan

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme.

Parameter ini (bersama dengan 'shard') menunjukkan jumlah partisi yang digunakan dalam keseluruhan komputasi.

Defaultnya adalah 1

Benih

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Jika salah satu seed atau seed2 disetel bukan nol, pembuat nomor acak akan diunggulkan oleh seed yang diberikan.

Jika tidak, ia akan diunggulkan dengan benih acak.

Defaultnya adalah 0

Benih2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Benih kedua untuk menghindari benturan benih.

Defaultnya adalah 0

Beling

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme.

Parameter ini (bersama dengan 'num_shards') menunjukkan nomor partisi tertentu dari operasi sampler, ketika partisi sedang digunakan.

Defaultnya adalah 0

Unigram

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan.

Tepatnya salah satu vocab_file dan unigram harus diteruskan ke operasi ini.

Defaultnya adalah []

File Kosakata

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

Setiap baris yang valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid.

ID disusun secara berurutan, dimulai dari num_reserved_ids. Entri terakhir di setiap baris diharapkan berupa nilai yang sesuai dengan hitungan atau probabilitas relatif. Tepatnya salah satu vocab_file dan unigram perlu diteruskan ke operasi ini.

Defaultnya adalah ""