publiczna klasa statyczna FixUnigramCandidateSampler.Options
Opcjonalne atrybuty dla FixedUnigramCandidateSampler
Metody publiczne
NaprawionoUnigramCandidateSampler.Options | zniekształcenie (zniekształcenie pływające) |
NaprawionoUnigramCandidateSampler.Options | numReservedIds (długie numReservedIds) |
NaprawionoUnigramCandidateSampler.Options | numShards (długie numShards) |
NaprawionoUnigramCandidateSampler.Options | nasiona (długie nasiona) |
NaprawionoUnigramCandidateSampler.Options | nasiona 2 (Długie nasiona 2) |
NaprawionoUnigramCandidateSampler.Options | odłamek (długi odłamek) |
NaprawionoUnigramCandidateSampler.Options | unigramy (List<Float> unigramy) |
NaprawionoUnigramCandidateSampler.Options | vocabFile (String vocabFile) |
Metody dziedziczone
Metody publiczne
publiczne Zniekształcenie FixUnigramCandidateSampler.Options (zniekształcenie typu Float)
Parametry
zniekształcenie | Zniekształcenie służy do zniekształcenia rozkładu prawdopodobieństwa unigramu. Każda waga jest najpierw podnoszona do mocy zniekształcenia przed dodaniem do wewnętrznego rozkładu unigramów. W rezultacie zniekształcenie = 1,0 daje regularne próbkowanie unigramów (zgodnie z definicją w pliku słownika), a zniekształcenie = 0,0 daje równomierny rozkład. |
---|
public FixUnigramCandidateSampler.Options numReservedIds (długie numReservedIds)
Parametry
numReservedIds | Opcjonalnie użytkownicy mogą dodać zastrzeżone identyfikatory z zakresu [0, ..., num_reserved_ids). Jednym z przypadków użycia jest użycie specjalnego tokenu nieznanego słowa jako identyfikatora 0. Prawdopodobieństwo próbkowania tych identyfikatorów będzie wynosić 0. |
---|
public FixUnigramCandidateSampler.Options numShards (Long numShards)
Parametry
liczbaodłamków | Próbnik może służyć do próbkowania z podzbioru pierwotnego zakresu, aby przyspieszyć całe obliczenia poprzez równoległość. Ten parametr (wraz z „shard”) wskazuje liczbę partycji używanych w ogólnych obliczeniach. |
---|
publiczny materiał siewny FixUnigramCandidateSampler.Options (długie nasiona)
Parametry
nasionko | Jeśli ziarno lub ziarno2 jest ustawione na wartość różną od zera, generator liczb losowych jest zaszczepiany przez dane ziarno. W przeciwnym razie jest on zaszczepiany losowo. |
---|
public FixUnigramCandidateSampler.Options ziarno2 (długie ziarno2)
Parametry
ziarno2 | Drugie ziarno, aby uniknąć kolizji nasion. |
---|
publiczny fragment FixUnigramCandidateSampler.Options (długi fragment)
Parametry
czerep | Próbnik może służyć do próbkowania z podzbioru pierwotnego zakresu, aby przyspieszyć całe obliczenia poprzez równoległość. Ten parametr (wraz z „num_shards”) wskazuje konkretny numer partycji operacji próbnika, gdy używane jest partycjonowanie. |
---|
publiczne unigramy FixUnigramCandidateSampler.Options (unigramy List<Float>)
Parametry
unigramy | Lista zliczeń lub prawdopodobieństw unigramów, po jednym na każdy identyfikator w kolejności sekwencyjnej. Do tej operacji należy przekazać dokładnie jeden z plików vocab_file i unigramów. |
---|
public FixUnigramCandidateSampler.Options vocabFile (String vocabFile)
Parametry
plik vocab | Każda prawidłowa linia w tym pliku (który powinien mieć format podobny do CSV) odpowiada prawidłowemu identyfikatorowi słowa. Identyfikatory są uporządkowane sekwencyjnie, zaczynając od num_reserved_ids. Oczekuje się, że ostatni wpis w każdym wierszu będzie wartością odpowiadającą liczbie lub prawdopodobieństwu względnemu. Do tej operacji należy przekazać dokładnie jeden z plików vocab_file i unigramów. |
---|