FixedUnigramCandidateSampler.Options

publiczna klasa statyczna FixUnigramCandidateSampler.Options

Opcjonalne atrybuty dla FixedUnigramCandidateSampler

Metody publiczne

NaprawionoUnigramCandidateSampler.Options
zniekształcenie (zniekształcenie pływające)
NaprawionoUnigramCandidateSampler.Options
numReservedIds (długie numReservedIds)
NaprawionoUnigramCandidateSampler.Options
numShards (długie numShards)
NaprawionoUnigramCandidateSampler.Options
nasiona (długie nasiona)
NaprawionoUnigramCandidateSampler.Options
nasiona 2 (Długie nasiona 2)
NaprawionoUnigramCandidateSampler.Options
odłamek (długi odłamek)
NaprawionoUnigramCandidateSampler.Options
unigramy (List<Float> unigramy)
NaprawionoUnigramCandidateSampler.Options
vocabFile (String vocabFile)

Metody dziedziczone

Metody publiczne

publiczne Zniekształcenie FixUnigramCandidateSampler.Options (zniekształcenie typu Float)

Parametry
zniekształcenie Zniekształcenie służy do zniekształcenia rozkładu prawdopodobieństwa unigramu. Każda waga jest najpierw podnoszona do mocy zniekształcenia przed dodaniem do wewnętrznego rozkładu unigramów. W rezultacie zniekształcenie = 1,0 daje regularne próbkowanie unigramów (zgodnie z definicją w pliku słownika), a zniekształcenie = 0,0 daje równomierny rozkład.

public FixUnigramCandidateSampler.Options numReservedIds (długie numReservedIds)

Parametry
numReservedIds Opcjonalnie użytkownicy mogą dodać zastrzeżone identyfikatory z zakresu [0, ..., num_reserved_ids). Jednym z przypadków użycia jest użycie specjalnego tokenu nieznanego słowa jako identyfikatora 0. Prawdopodobieństwo próbkowania tych identyfikatorów będzie wynosić 0.

public FixUnigramCandidateSampler.Options numShards (Long numShards)

Parametry
liczbaodłamków Próbnik może służyć do próbkowania z podzbioru pierwotnego zakresu, aby przyspieszyć całe obliczenia poprzez równoległość. Ten parametr (wraz z „shard”) wskazuje liczbę partycji używanych w ogólnych obliczeniach.

publiczny materiał siewny FixUnigramCandidateSampler.Options (długie nasiona)

Parametry
nasionko Jeśli ziarno lub ziarno2 jest ustawione na wartość różną od zera, generator liczb losowych jest zaszczepiany przez dane ziarno. W przeciwnym razie jest on zaszczepiany losowo.

public FixUnigramCandidateSampler.Options ziarno2 (długie ziarno2)

Parametry
ziarno2 Drugie ziarno, aby uniknąć kolizji nasion.

publiczny fragment FixUnigramCandidateSampler.Options (długi fragment)

Parametry
czerep Próbnik może służyć do próbkowania z podzbioru pierwotnego zakresu, aby przyspieszyć całe obliczenia poprzez równoległość. Ten parametr (wraz z „num_shards”) wskazuje konkretny numer partycji operacji próbnika, gdy używane jest partycjonowanie.

publiczne unigramy FixUnigramCandidateSampler.Options (unigramy List<Float>)

Parametry
unigramy Lista zliczeń lub prawdopodobieństw unigramów, po jednym na każdy identyfikator w kolejności sekwencyjnej. Do tej operacji należy przekazać dokładnie jeden z plików vocab_file i unigramów.

public FixUnigramCandidateSampler.Options vocabFile (String vocabFile)

Parametry
plik vocab Każda prawidłowa linia w tym pliku (który powinien mieć format podobny do CSV) odpowiada prawidłowemu identyfikatorowi słowa. Identyfikatory są uporządkowane sekwencyjnie, zaczynając od num_reserved_ids. Oczekuje się, że ostatni wpis w każdym wierszu będzie wartością odpowiadającą liczbie lub prawdopodobieństwu względnemu. Do tej operacji należy przekazać dokładnie jeden z plików vocab_file i unigramów.