flujo tensor:: operaciones:: FijoUnigramCandidateSampler:: atributos

#include <candidate_sampling_ops.h>

Configuradores de atributos opcionales para FixedUnigramCandidateSampler .

Resumen

Atributos públicos

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

Funciones públicas

Distortion (float x)
TF_MUST_USE_RESULT Attrs
La distorsión se utiliza para sesgar la distribución de probabilidad unigramo.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
Opcionalmente, los usuarios pueden agregar algunas ID reservadas en el rango [0, ..., num_reserved_ids).
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
Se puede utilizar un muestreador para tomar muestras de un subconjunto del rango original con el fin de acelerar todo el cálculo mediante el paralelismo.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Si seed o seed2 se configuran como distintos de cero, el generador de números aleatorios se siembra con la semilla dada.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
Una segunda semilla para evitar la colisión de semillas.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
Se puede utilizar un muestreador para tomar muestras de un subconjunto del rango original con el fin de acelerar todo el cálculo mediante el paralelismo.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
Una lista de recuentos o probabilidades de unigramas, uno por ID en orden secuencial.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
Cada línea válida en este archivo (que debe tener un formato similar a CSV) corresponde a una identificación de palabra válida.

Atributos públicos

distorsión_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_id_reservados_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_fragmentos_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

semilla2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

semilla_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

casco_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigramas_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

archivo_vocab_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Funciones públicas

Distorsión

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

La distorsión se utiliza para sesgar la distribución de probabilidad unigrama.

Cada peso se eleva primero a la potencia de distorsión antes de agregarlo a la distribución interna de unigramos. Como resultado, la distorsión = 1,0 proporciona un muestreo de unigrama regular (como se define en el archivo de vocabulario) y la distorsión = 0,0 proporciona una distribución uniforme.

Por defecto es 1

NúmReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

Opcionalmente, los usuarios pueden agregar algunas ID reservadas en el rango [0, ..., num_reserved_ids).

Un caso de uso es que se utiliza un token especial de palabra desconocida como ID 0. Estos ID tendrán una probabilidad de muestreo de 0.

Por defecto es 0

NumFragmentos

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Se puede utilizar un muestreador para tomar muestras de un subconjunto del rango original con el fin de acelerar todo el cálculo mediante el paralelismo.

Este parámetro (junto con 'shard') indica el número de particiones que se utilizan en el cálculo general.

Por defecto es 1

Semilla

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Si seed o seed2 se configuran como distintos de cero, el generador de números aleatorios se siembra con la semilla dada.

De lo contrario, se siembra con una semilla aleatoria.

Por defecto es 0

Semilla2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Una segunda semilla para evitar la colisión de semillas.

Por defecto es 0

Casco

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Se puede utilizar un muestreador para tomar muestras de un subconjunto del rango original con el fin de acelerar todo el cálculo mediante el paralelismo.

Este parámetro (junto con 'num_shards') indica el número de partición particular de una operación de muestra, cuando se utiliza la partición.

Por defecto es 0

Unigramas

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Una lista de recuentos o probabilidades de unigramas, uno por ID en orden secuencial.

Se debe pasar exactamente uno de vocab_file y unigramas a esta operación.

El valor predeterminado es []

Archivo de vocabulario

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

Cada línea válida en este archivo (que debe tener un formato similar a CSV) corresponde a una identificación de palabra válida.

Los ID están en orden secuencial, comenzando desde num_reserved_ids. Se espera que la última entrada en cada línea sea un valor correspondiente al recuento o probabilidad relativa. Se debe pasar exactamente uno de vocab_file y unigramas a esta operación.

El valor predeterminado es ""