Convierte los parámetros de CudnnRNN de forma canónica a forma utilizable. Soporta la proyección en LSTM.
Escribe un conjunto de pesos en el búfer de parámetros opacos para que se puedan usar en futuros entrenamientos o inferencias.
Tenga en cuenta que es posible que el búfer de parámetros no sea compatible con diferentes GPU. Por lo tanto, cualquier guardado y restauración debe convertirse hacia y desde los pesos y sesgos canónicos.
num_layers: especifica el número de capas en el modelo RNN. num_units: especifica el tamaño del estado oculto. input_size: especifica el tamaño del estado de entrada. pesos: la forma canónica de pesos que se puede utilizar para guardar y restaurar. Es más probable que sean compatibles entre diferentes generaciones. sesgos: la forma canónica de sesgos que se puede utilizar para salvar y restaurar. Es más probable que sean compatibles entre diferentes generaciones. num_params_weights: número de matriz de parámetros de peso para todas las capas. num_params_biases: número de vector de parámetro de sesgo para todas las capas. rnn_mode: Indica el tipo de modelo RNN. input_mode: indica si hay una proyección lineal entre la entrada y el cálculo real antes de la primera capa. 'skip_input' solo se permite cuando input_size == num_units; 'auto_select' implica 'skip_input' cuando input_size == num_units; de lo contrario, implica 'linear_input'. direction: Indica si se utilizará un modelo bidireccional. dir = (dirección == bidireccional)? Abandono 2: 1: probabilidad de abandono. Cuando se establece en 0., la deserción está deshabilitada. semilla: la primera parte de una semilla para inicializar la deserción. seed2: la segunda parte de una semilla para inicializar la deserción. num_proj: La dimensionalidad de salida para las matrices de proyección. Si Ninguno o 0, no se realiza ninguna proyección.
Clases anidadas
clase | CudnnRNNCanonicalToParams.Options | Los atributos opcionales para CudnnRNNCanonicalToParams |
Constantes
Cuerda | OP_NAME | El nombre de esta operación, como lo conoce el motor central de TensorFlow |
Métodos públicos
Salida <T> | asOutput () Devuelve el identificador simbólico del tensor. |
estática <T se extiende TNumber > CudnnRNNCanonicalToParams <T> | crear ( Alcance alcance, operando < TInt32 > numLayers, operando < TInt32 > numUnits, operando < TInt32 > inputSize, Iterable < operando <T >> pesos, Iterable < operando <T >> sesgos, Opciones ... Opciones) Método de fábrica para crear una clase que envuelva una nueva operación CudnnRNNCanonicalToParams. |
estáticas CudnnRNNCanonicalToParams.Options | dirección (dirección String) |
estáticas CudnnRNNCanonicalToParams.Options | deserción (deserción Float) |
estáticas CudnnRNNCanonicalToParams.Options | InputMode (String InputMode) |
estáticas CudnnRNNCanonicalToParams.Options | numProj (Long numProj) |
Salida <T> | params () |
estáticas CudnnRNNCanonicalToParams.Options | rnnMode (String rnnMode) |
estáticas CudnnRNNCanonicalToParams.Options | semilla (semilla de larga duración) |
estáticas CudnnRNNCanonicalToParams.Options | seed2 (Long seed2) |
Métodos heredados
Constantes
OP_NAME pública final static String
El nombre de esta operación, como lo conoce el motor central de TensorFlow
Métodos públicos
pública de salida <T> asOutput ()
Devuelve el identificador simbólico del tensor.
Las entradas a las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.
public static CudnnRNNCanonicalToParams <T> crear ( Alcance alcance, operando < TInt32 > numLayers, operando < TInt32 > numUnits, operando < TInt32 > inputSize, Iterable < operando <T >> pesos, Iterable < operando <T >> sesgos, Opciones .. . opciones)
Método de fábrica para crear una clase que envuelva una nueva operación CudnnRNNCanonicalToParams.
Parámetros
alcance | alcance actual |
---|---|
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de CudnnRNNCanonicalToParams