kelas statis publik FixedUnigramCandidateSampler.Options
Atribut opsional untuk FixedUnigramCandidateSampler
Metode Publik
MemperbaikiUnigramCandidateSampler.Options | distorsi (Distorsi mengambang) |
MemperbaikiUnigramCandidateSampler.Options | numReservedIds (JumlahReservedIds panjang) |
MemperbaikiUnigramCandidateSampler.Options | numShards (NumShards panjang) |
MemperbaikiUnigramCandidateSampler.Options | benih (biji panjang) |
MemperbaikiUnigramCandidateSampler.Options | seed2 (Benih panjang2) |
MemperbaikiUnigramCandidateSampler.Options | pecahan (Pecahan panjang) |
MemperbaikiUnigramCandidateSampler.Options | unigram (Daftar<Float> unigram) |
MemperbaikiUnigramCandidateSampler.Options | vocabFile (String vocabFile) |
Metode Warisan
Metode Publik
public FixedUnigramCandidateSampler. Distorsi opsi (Distorsi mengambang)
Parameter
distorsi | Distorsi digunakan untuk mendistorsi distribusi probabilitas unigram. Setiap bobot pertama-tama dinaikkan ke kekuatan distorsi sebelum ditambahkan ke distribusi unigram internal. Hasilnya, distorsi = 1.0 memberikan pengambilan sampel unigram yang teratur (seperti yang ditentukan oleh file vocab), dan distorsi = 0.0 memberikan distribusi yang seragam. |
---|
public FixedUnigramCandidateSampler.Options numReservedIds (Jumlah PanjangReservedIds)
Parameter
jumlahReservedIds | Secara opsional, beberapa ID yang dicadangkan dapat ditambahkan dalam rentang [0, ..., num_reserved_ids) oleh pengguna. Salah satu kasus penggunaannya adalah token kata khusus yang tidak diketahui digunakan sebagai ID 0. ID ini akan memiliki probabilitas pengambilan sampel sebesar 0. |
---|
public FixedUnigramCandidateSampler.Options numShards (NumShards panjang)
Parameter
jumlah pecahan | Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme. Parameter ini (bersama dengan 'shard') menunjukkan jumlah partisi yang digunakan dalam keseluruhan komputasi. |
---|
public FixedUnigramCandidateSampler.Options seed (Benih panjang)
Parameter
benih | Jika salah satu seed atau seed2 disetel bukan nol, pembuat nomor acak akan diunggulkan oleh seed yang diberikan. Jika tidak, ia akan diunggulkan dengan benih acak. |
---|
public FixedUnigramCandidateSampler.Options seed2 (Benih panjang2)
Parameter
benih2 | Benih kedua untuk menghindari benturan benih. |
---|
public FixedUnigramCandidateSampler.Options shard (Pecahan panjang)
Parameter
beling | Sampler dapat digunakan untuk mengambil sampel dari subset rentang asli untuk mempercepat keseluruhan komputasi melalui paralelisme. Parameter ini (bersama dengan 'num_shards') menunjukkan nomor partisi tertentu dari operasi sampler, ketika partisi sedang digunakan. |
---|
public FixedUnigramCandidateSampler.Options unigram (Daftar<Float> unigram)
Parameter
unigram | Daftar jumlah atau probabilitas unigram, satu per ID secara berurutan. Tepatnya salah satu vocab_file dan unigram harus diteruskan ke operasi ini. |
---|
FixedUnigramCandidateSampler.Options vocabFile (String vocabFile) publik
Parameter
File kosakata | Setiap baris yang valid dalam file ini (yang harus memiliki format seperti CSV) sesuai dengan ID kata yang valid. ID disusun secara berurutan, dimulai dari num_reserved_ids. Entri terakhir di setiap baris diharapkan berupa nilai yang sesuai dengan hitungan atau probabilitas relatif. Tepatnya salah satu vocab_file dan unigram perlu diteruskan ke operasi ini. |
---|