FixedUnigramCandidateSampler.Options

genel statik sınıf FixUnigramCandidateSampler.Options

FixedUnigramCandidateSampler için isteğe bağlı özellikler

Genel Yöntemler

SabitUnigramCandidateSampler.Options
distorsiyon (Kayan distorsiyon)
SabitUnigramCandidateSampler.Options
numReservedIds (Uzun numReservedIds)
SabitUnigramCandidateSampler.Options
numShards (Uzun numShards)
SabitUnigramCandidateSampler.Options
tohum (Uzun tohum)
SabitUnigramCandidateSampler.Options
tohum2 (Uzun tohum2)
SabitUnigramCandidateSampler.Options
parça (Uzun parça)
SabitUnigramCandidateSampler.Options
unigramlar (Liste<Float> unigramlar)
SabitUnigramCandidateSampler.Options
vocabDosyası (Dize vocabDosyası)

Kalıtsal Yöntemler

Genel Yöntemler

public DifferentUnigramCandidateSampler.Options distorsiyonu (Float distorsiyonu)

Parametreler
çarpıtma Distorsiyon, unigram olasılık dağılımını çarpıtmak için kullanılır. Her ağırlık, dahili unigram dağılımına eklenmeden önce ilk olarak distorsiyonun gücüne yükseltilir. Sonuç olarak, distorsiyon = 1,0, düzenli unigram örneklemeyi (kelime dosyası tarafından tanımlandığı gibi) verir ve distorsiyon = 0,0, düzgün bir dağılım verir.

public DifferentUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)

Parametreler
numReservedIds İsteğe bağlı olarak kullanıcılar tarafından [0, ..., num_reserved_ids) aralığında bazı ayrılmış ID'ler eklenebilir. Bir kullanım durumu, özel bir bilinmeyen kelime belirtecinin ID 0 olarak kullanılmasıdır. Bu ID'lerin örnekleme olasılığı 0 olacaktır.

public DifferentUnigramCandidateSampler.Options numShards (Uzun numShards)

Parametreler
SayıParçaları Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir. Bu parametre ('shard' ile birlikte) genel hesaplamada kullanılan bölüm sayısını gösterir.

public DifferentUnigramCandidateSampler.Options tohumu (Uzun tohum)

Parametreler
tohum Tohum veya tohum2 sıfırdan farklı bir değere ayarlanmışsa, rastgele sayı üreteci verilen tohum tarafından tohumlanır. Aksi takdirde rastgele bir tohumla tohumlanır.

public SabitUnigramCandidateSampler.Options tohum2 (Uzun tohum2)

Parametreler
tohum2 Tohum çarpışmasını önlemek için ikinci bir tohum.

public DifferentUnigramCandidateSampler.Options parça (Uzun parça)

Parametreler
kırık Paralellik yoluyla tüm hesaplamayı hızlandırmak amacıyla orijinal aralığın bir alt kümesinden örnekleme yapmak için bir örnekleyici kullanılabilir. Bu parametre ('num_shards' ile birlikte), bölümleme kullanıldığında bir örnekleyici işleminin belirli bölüm numarasını gösterir.

public DifferentUnigramCandidateSampler.Options unigramları (List<Float> unigramları)

Parametreler
unigramlar Unigram sayımlarının veya olasılıklarının, kimlik başına sıralı bir şekilde bir listesi. Bu operasyona vocab_file ve unigramlardan tam olarak biri aktarılmalıdır.

public DifferentUnigramCandidateSampler.Options vocabFile (String vocabFile)

Parametreler
kelimeDosyası Bu dosyadaki (CSV benzeri bir formata sahip olması gereken) her geçerli satır, geçerli bir kelime kimliğine karşılık gelir. Kimlikler num_reserved_ids'den başlayarak sıralıdır. Her satırdaki son girişin sayıma veya bağıl olasılığa karşılık gelen bir değer olması beklenir. Bu operasyona vocab_file ve unigramlardan tam olarak birinin aktarılması gerekiyor.