FixedUnigramCandidateSampler.Options

kelas statis publik FixedUnigramCandidateSampler.Options

Atribut opsional untuk FixedUnigramCandidateSampler

Metode Publik

MemperbaikiUnigramCandidateSampler.Options
distorsi (Distorsi mengambang)
MemperbaikiUnigramCandidateSampler.Options
numReservedIds (JumlahReservedIds panjang)
MemperbaikiUnigramCandidateSampler.Options
numShards (NumShards panjang)
MemperbaikiUnigramCandidateSampler.Options
benih (biji panjang)
MemperbaikiUnigramCandidateSampler.Options
seed2 (Benih panjang2)
MemperbaikiUnigramCandidateSampler.Options
pecahan (Pecahan panjang)
MemperbaikiUnigramCandidateSampler.Options
unigram (Daftar<Float> unigram)
MemperbaikiUnigramCandidateSampler.Options
vocabFile (String vocabFile)

Metode Warisan

Metode Publik

public FixedUnigramCandidateSampler. Distorsi opsi (Distorsi mengambang)

Parameter
distorsi Distorsi digunakan untuk mendistorsi distribusi probabilitas unigram. Setiap bobot pertama-tama dinaikkan ke kekuatan distorsi sebelum ditambahkan ke distribusi unigram internal. Hasilnya, distorsi = 1.0 memberikan pengambilan sampel unigram yang teratur (seperti yang ditentukan oleh file vocab), dan distorsi = 0.0 memberikan distribusi yang seragam.

public FixedUnigramCandidateSampler.Options numReservedIds (Jumlah PanjangReservedIds)

Parameter
jumlahReservedIds Secara opsional, beberapa ID yang dicadangkan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna. Salah satu kasus penggunaannya adalah token kata khusus yang tidak diketahui digunakan sebagai ID 0. ID ini akan memiliki probabilitas pengambilan sampel sebesar 0.

public FixedUnigramCandidateSampler.Options numShards (NumShards panjang)

Parameter
jumlah pecahan Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme. Parameter ini (bersama dengan 'shard') menunjukkan jumlah partisi yang digunakan dalam keseluruhan komputasi.

public FixedUnigramCandidateSampler.Options seed (Benih panjang)

Parameter
benih Jika salah satu seed atau seed2 disetel bukan nol, pembuat nomor acak akan diunggulkan oleh seed yang diberikan. Jika tidak, ia akan diunggulkan dengan benih acak.

public FixedUnigramCandidateSampler.Options seed2 (Benih panjang2)

Parameter
benih2 Benih kedua untuk menghindari benturan benih.

public FixedUnigramCandidateSampler.Options shard (Pecahan panjang)

Parameter
beling Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme. Parameter ini (bersama dengan 'num_shards') menunjukkan nomor partisi tertentu dari operasi sampler, ketika partisi sedang digunakan.

public FixedUnigramCandidateSampler.Options unigram (Daftar<Float> unigram)

Parameter
unigram Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan. Tepatnya salah satu vocab_file dan unigram harus diteruskan ke operasi ini.

FixedUnigramCandidateSampler.Options vocabFile (String vocabFile) publik

Parameter
File kosakata Setiap baris yang valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid. ID disusun secara berurutan, dimulai dari num_reserved_ids. Entri terakhir di setiap baris diharapkan berupa nilai yang sesuai dengan hitungan atau probabilitas relatif. Tepatnya salah satu vocab_file dan unigram perlu diteruskan ke operasi ini.