Esta página se ha traducido con Cloud Translation API.

GRUBlockCellGrad

clase final pública GRUBlockCellGrad

Calcula la retropropagación de la celda GRU durante 1 paso de tiempo.

Args x: Entrada a la celda GRU. h_prev: entrada de estado de la celda GRU anterior. w_ru: Matriz de pesos para la puerta de reinicio y actualización. w_c: Matriz de pesos de la compuerta de conexión de la celda. b_ru: Vector de polarización para la puerta de reinicio y actualización. b_c: Vector de polarización de la puerta de conexión de la celda. r: Salida de la puerta de reinicio. u: Salida de la puerta de actualización. c: Salida de la puerta de conexión de la celda. d_h: gradientes de h_new wrt a la función objetivo.

Devuelve d_x: gradientes de x wrt a la función objetivo. d_h_prev: gradientes de h wrt a la función objetivo. d_c_bar Degradados de c_bar wrt a la función objetivo. d_r_bar_u_bar Degradados de r_bar y u_bar wrt a la función objetivo.

Esta operación del núcleo implementa las siguientes ecuaciones matemáticas:

Nota sobre la notación de las variables:

La concatenación de a y b está representada por a_b El producto escalar por elementos de a y b está representado por ab El producto escalar por elementos está representado por \circ La multiplicación de matrices está representada por *

Notas adicionales para mayor claridad:

`w_ru` se puede segmentar en 4 matrices diferentes.

w_ru = [w_r_x w_u_x
         w_r_h_prev w_u_h_prev]

De manera similar, `w_c` se puede segmentar en 2 matrices diferentes.

w_c = [w_c_x w_c_h_prevr]

Lo mismo ocurre con los prejuicios.

b_ru = [b_ru_x b_ru_h]
 b_c = [b_c_x b_c_h]

Otra nota sobre notación:

d_x = d_x_component_1 + d_x_component_2
 
 where d_x_component_1 = d_r_bar * w_r_x^T + d_u_bar * w_r_x^T
 and d_x_component_2 = d_c_bar * w_c_x^T
 
 d_h_prev = d_h_prev_component_1 + d_h_prevr \circ r + d_h \circ u
 where d_h_prev_componenet_1 = d_r_bar * w_r_h_prev^T + d_u_bar * w_r_h_prev^T

Matemáticas detrás de los siguientes degradados:

d_c_bar = d_h \circ (1-u) \circ (1-c \circ c)
 d_u_bar = d_h \circ (h-c) \circ u \circ (1-u)
 
 d_r_bar_u_bar = [d_r_bar d_u_bar]
 
 [d_x_component_1 d_h_prev_component_1] = d_r_bar_u_bar * w_ru^T
 
 [d_x_component_2 d_h_prevr] = d_c_bar * w_c^T
 
 d_x = d_x_component_1 + d_x_component_2
 
 d_h_prev = d_h_prev_component_1 + d_h_prevr \circ r + u

El siguiente cálculo se realiza en el contenedor de Python para los degradados (no en el núcleo del degradado).

d_w_ru = x_h_prevr^T * d_c_bar
 
 d_w_c = x_h_prev^T * d_r_bar_u_bar
 
 d_b_ru = sum of d_r_bar_u_bar along axis = 0
 
 d_b_c = sum of d_c_bar along axis = 0

Constantes

Cadena OP_NOMBRE El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Métodos públicos

estático <T extiende TNumber > GRUBlockCellGrad <T>	crear ( Alcance alcance, Operando <T> x, Operando <T> hPrev, Operando <T> wRu, Operando <T> wC, Operando <T> bRu, Operando <T> bC, Operando <T> r, Operando <T > u, Operando <T> c, Operando <T> dH) Método de fábrica para crear una clase que envuelve una nueva operación GRUBlockCellGrad.
Salida <T>	dCBar ()
Salida <T>	dHPrev ()
Salida <T>	dRBarUBar ()
Salida <T>	dx ()

Métodos heredados

De la clase org.tensorflow.op.RawOp

booleano final	es igual (Objeto obj)
entero final	código hash ()
Operación	operación () Devuelve esta unidad de cálculo como una única `Operation` .
cadena final	a cadena ()

De la clase java.lang.Object

booleano	es igual (Objeto arg0)
Clase final<?>	obtenerclase ()
entero	código hash ()
vacío final	notificar ()
vacío final	notificar a todos ()
Cadena	a cadena ()
vacío final	esperar (arg0 largo, int arg1)
vacío final	espera (arg0 largo)
vacío final	esperar ()

Desde la interfaz org.tensorflow.op.Op

entorno de ejecución abstracto	entorno () Devuelve el entorno de ejecución en el que se creó esta operación.
operación abstracta	operación () Devuelve esta unidad de cálculo como una única `Operation` .

Constantes

Cadena final estática pública OP_NAME

El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Valor constante: "GRUBlockCellGrad"

Métodos públicos

público estático GRUBlockCellGrad <T> crear ( Alcance alcance, Operando <T> x, Operando <T> hPrev, Operando <T> wRu, Operando <T> wC, Operando <T> bRu, Operando <T> bC, Operando <T > r, Operando <T> u, Operando <T> c, Operando <T> dH)

Método de fábrica para crear una clase que envuelve una nueva operación GRUBlockCellGrad.

Parámetros

alcance	alcance actual

GRUBlockCellGrad

Constantes

Métodos públicos

Métodos heredados

Constantes

Cadena final estática pública OP_NAME

Métodos públicos

público estático GRUBlockCellGrad <T> crear ( Alcance alcance, Operando <T> x, Operando <T> hPrev, Operando <T> wRu, Operando <T> wC, Operando <T> bRu, Operando <T> bC, Operando <T > r, Operando <T> u, Operando <T> c, Operando <T> dH)

Parámetros

Devoluciones

Salida pública <T> dCBar ()

Salida pública <T> dHPrev ()

Salida pública <T> dRBarUBar ()

Salida pública <T> dX ()

GRUBlockCellGrad Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Constantes

Métodos públicos

Métodos heredados

Constantes

Cadena final estática pública OP_NAME

Métodos públicos

público estático GRUBlockCellGrad <T> crear ( Alcance alcance, Operando <T> x, Operando <T> hPrev, Operando <T> wRu, Operando <T> wC, Operando <T> bRu, Operando <T> bC, Operando <T > r, Operando <T> u, Operando <T> c, Operando <T> dH)

Parámetros

Devoluciones

Salida pública <T> dCBar ()

Salida pública <T> dHPrev ()

Salida pública <T> dRBarUBar ()

Salida pública <T> dX ()

GRUBlockCellGrad