Recupera los parámetros de CudnnRNN en forma canónica. Soporta la proyección en LSTM.
Recupera un conjunto de pesos del búfer de parámetros opaco que se puede guardar y restaurar de forma compatible con ejecuciones futuras.
Tenga en cuenta que es posible que el búfer de parámetros no sea compatible entre diferentes GPU. Por lo tanto, cualquier salvado y restauración debe convertirse desde y hacia los pesos y sesgos canónicos.
num_layers: especifica el número de capas en el modelo RNN. num_units: especifica el tamaño del estado oculto. input_size: especifica el tamaño del estado de entrada. num_params_weights: número de matriz de parámetros de peso para todas las capas. num_params_biases: número de vectores de parámetros de polarización para todas las capas. pesos: la forma canónica de pesos que se pueden utilizar para guardar y restaurar. Es más probable que sean compatibles entre diferentes generaciones. Sesgos: la forma canónica de sesgos que se puede utilizar para salvar y restaurar. Es más probable que sean compatibles entre diferentes generaciones. rnn_mode: Indica el tipo de modelo RNN. input_mode: indica si hay una proyección lineal entre la entrada y el cálculo real antes de la primera capa. 'skip_input' solo se permite cuando input_size == num_units; 'auto_select' implica 'skip_input' cuando input_size == num_units; de lo contrario, implica 'entrada_lineal'. dirección: Indica si se utilizará un modelo bidireccional. dir = (dirección == bidireccional)? Abandono 2:1: probabilidad de abandono. Cuando se establece en 0, el abandono está deshabilitado. semilla: la primera parte de una semilla para inicializar el abandono. semilla2: la segunda parte de una semilla para inicializar el abandono. num_proj: la dimensionalidad de salida para las matrices de proyección. Si es Ninguno o 0, no se realiza ninguna proyección.
Clases anidadas
clase | CudnnRNNParamsToCanonical.Options | Atributos opcionales para CudnnRNNParamsToCanonical |
Constantes
Cadena | OP_NOMBRE | El nombre de esta operación, como lo conoce el motor central de TensorFlow. |
Métodos públicos
Lista< Salida <T>> | sesgos () |
estático <T extiende TNumber > CudnnRNNParamsToCanonical <T> | crear ( alcance alcance, Operando < TInt32 > numLayers, Operando < TInt32 > numUnits, Operando < TInt32 > inputSize, Operando <T> parámetros, Long numParamsWeights, Long numParamsBiases, Opciones... opciones) Método de fábrica para crear una clase que envuelve una nueva operación CudnnRNNParamsToCanonical. |
CudnnRNNParamsToCanonical.Options estático | dirección (dirección de la cuerda) |
CudnnRNNParamsToCanonical.Options estático | abandono (abandono flotante) |
CudnnRNNParamsToCanonical.Options estático | modo de entrada (modo de entrada de cadena) |
CudnnRNNParamsToCanonical.Options estático | numProj (NúmProj largo) |
CudnnRNNParamsToCanonical.Options estático | rnnMode (cadena rnnMode) |
CudnnRNNParamsToCanonical.Options estático | semilla (semilla larga) |
CudnnRNNParamsToCanonical.Options estático | semilla2 (semilla larga2) |
Lista< Salida <T>> | pesos () |
Métodos heredados
Constantes
Cadena final estática pública OP_NAME
El nombre de esta operación, como lo conoce el motor central de TensorFlow.
Métodos públicos
public static CudnnRNNParamsToCanonical <T> create (Ámbito de alcance , Operando < TInt32 > numLayers, Operando < TInt32 > numUnits, Operando < TInt32 > inputSize, Operando <T> parámetros, Long numParamsWeights, Long numParamsBiases, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación CudnnRNNParamsToCanonical.
Parámetros
alcance | alcance actual |
---|---|
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de CudnnRNNParamsToCanonical