Paso de respaldo de CudnnRNNV3.
Calcule el backprop de datos y pesos en un RNN. Toma una entrada adicional de "sequence_lengths" que CudnnRNNBackprop.
rnn_mode: Indica el tipo de modelo RNN. input_mode: indica si hay una proyección lineal entre la entrada y el cálculo real antes de la primera capa. 'skip_input' solo se permite cuando input_size == num_units; 'auto_select' implica 'skip_input' cuando input_size == num_units; de lo contrario, implica 'entrada_lineal'. dirección: Indica si se utilizará un modelo bidireccional. Debe ser "unidireccional" o "bidireccional". abandono: Probabilidad de abandono. Cuando se establece en 0, el abandono está deshabilitado. semilla: la primera parte de una semilla para inicializar el abandono. semilla2: La segunda parte de una semilla para inicializar el abandono. entrada: si time_major es verdadero, este es un tensor 3-D con la forma de [seq_length, lote_size, input_size]. Si time_major es falso, la forma es [batch_size, seq_length, input_size]. input_h: si time_major es verdadero, este es un tensor tridimensional con la forma de [num_layer * dir, lote_size, num_units]. Si time_major es falso, la forma es [batch_size, num_layer * dir, num_units]. input_c: para LSTM, un tensor 3-D con la forma de [num_layer * dir, lote, num_units]. Para otros modelos, se ignora. params: un tensor 1-D que contiene los pesos y sesgos en un diseño opaco. El tamaño debe crearse mediante CudnnRNNParamsSize e inicializarse por separado. Tenga en cuenta que es posible que no sean compatibles entre diferentes generaciones. Por lo tanto, es una buena idea guardar y restaurar secuencia_longitudes: un vector de longitudes de cada secuencia de entrada. salida: si time_major es verdadero, este es un tensor tridimensional con la forma de [seq_length, lote_size, dir * num_units]. Si time_major es falso, la forma es [batch_size, seq_length, dir * num_units]. salida_h: La misma forma tiene entrada_h. output_c: la misma forma que input_c para LSTM. Un tensor vacío para otros modelos. output_backprop: un tensor 3-D con la misma forma que la salida en el pase hacia adelante. salida_h_backprop: un tensor 3-D con la misma forma que salida_h en el pase hacia adelante. salida_c_backprop: un tensor 3-D con la misma forma que salida_c en el pase hacia adelante. time_major: indica si el formato de entrada/salida es mayor por tiempo o por lotes. reserve_space: el mismo reserve_space producido en la operación directa. input_backprop: el backprop para ingresar en el pase hacia adelante. Tiene la misma forma que la entrada. input_h_backprop: el backprop de input_h en el pase hacia adelante. Tiene la misma forma que input_h. input_c_backprop: el backprop de input_c en el pase hacia adelante. Tiene la misma forma que input_c. params_backprop: la propiedad inversa del búfer de parámetros en el pase directo. Tiene la misma forma que params.
Clases anidadas
clase | CudnnRNNBackprop.Opciones | Atributos opcionales para CudnnRNNBackprop |
Constantes
Cadena | OP_NOMBRE | El nombre de esta operación, como lo conoce el motor central de TensorFlow. |
Métodos públicos
estático <T extiende TNumber > CudnnRNNBackprop <T> | crear (alcance alcance , entrada del operando <T>, entrada del operando <T>, entrada del operando <T> C, parámetros del operando <T>, longitudes de secuencia del operando <TInt32> , salida del operando <T>, salida del operando <T>, operando <T > salidaC, Operando <T> salidaBackprop, Operando <T> salidaHBackprop, Operando <T> salidaCBackprop, Operando <T> reserveSpace, Operando <?> hostReserved, Opciones... opciones) Método de fábrica para crear una clase que envuelve una nueva operación CudnnRNNBackprop. |
CudnnRNNBackprop.Options estático | dirección (dirección de la cuerda) |
CudnnRNNBackprop.Options estático | abandono (abandono flotante) |
Salida <T> | |
Salida <T> | |
Salida <T> | |
CudnnRNNBackprop.Options estático | modo de entrada (modo de entrada de cadena) |
CudnnRNNBackprop.Options estático | numProj (NúmProj largo) |
Salida <T> | |
CudnnRNNBackprop.Options estático | rnnMode (cadena rnnMode) |
CudnnRNNBackprop.Options estático | semilla (semilla larga) |
CudnnRNNBackprop.Options estático | semilla2 (semilla larga2) |
CudnnRNNBackprop.Options estático | timeMajor (tiempo booleano Major) |
Métodos heredados
Constantes
Cadena final estática pública OP_NAME
El nombre de esta operación, como lo conoce el motor central de TensorFlow.
Métodos públicos
public static CudnnRNNBackprop <T> create (Ámbito de alcance , Operando <T> entrada, Operando <T> entradaH, Operando <T> entradaC, Operando <T> parámetros, Operando <TInt32> longitudes de secuencia, Operando <T> salida, Operando <T > salidaH, Operando <T> salidaC, Operando <T> salidaBackprop, Operando <T> salidaHBackprop, Operando <T> salidaCBackprop, Operando <T> reserveSpace, Operando <?> hostReserved, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación CudnnRNNBackprop.
Parámetros
alcance | alcance actual |
---|---|
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de CudnnRNNBackprop