SparseSoftmaxCrossEntropyWithLogits

clase pública SparseSoftmaxCrossEntropyWithLogits

Constructores Públicos

Métodos públicos

estático <T extiende TNumber , U extiende TNumber > Operando
sparseSoftmaxCrossEntropyWithLogits (alcance del alcance , etiquetas del operando <T>, logits del operando <U>)
Calcula la entropía cruzada dispersa de softmax entre logits y labels .

Métodos heredados

Constructores Públicos

público SparseSoftmaxCrossEntropyWithLogits ()

Métodos públicos

Operando estático público dispersoSoftmaxCrossEntropyWithLogits (alcance del alcance , etiquetas del operando <T>, logits del operando <U>)

Calcula la entropía cruzada dispersa de softmax entre logits y labels .

Mide el error de probabilidad en tareas de clasificación discretas en las que las clases son mutuamente excluyentes (cada entrada pertenece exactamente a una clase). Por ejemplo, cada imagen CIFAR-10 está etiquetada con una y sólo una etiqueta: una imagen puede ser un perro o un camión, pero no ambos.

NOTA:

Para esta operación, la probabilidad de una etiqueta determinada se considera exclusiva. Es decir, no se permiten clases suaves y el vector labels debe proporcionar un único índice específico para la clase verdadera para cada fila de logits (cada entrada de minibatch). Para una clasificación softmax suave con una distribución de probabilidad para cada entrada, ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits) .

ADVERTENCIA:

Esta operación espera logits sin escalar, ya que realiza un softmax en logits internamente para mayor eficiencia. No llame a esta operación con la salida de softmax , ya que producirá resultados incorrectos.

Un caso de uso común es tener logits de forma [batchSize, numClasses] y tener etiquetas de forma [batchSize] , pero se admiten dimensiones más altas, en cuyo caso se supone que la dimensión dim -ésima es de tamaño numClasses . logits deben tener el tipo de datos de TFloat16 , TFloat32 o TFloat64 , y labels deben tener el tipo d TInt32 o TInt64 .

Parámetros
alcance alcance actual
etiquetas Tensor de forma [d_0, d_1, ..., d_{r-1}] (donde r es el rango de labels y el resultado) y el tipo de datos es TInt32 o TInt64 . Cada entrada en labels debe ser un índice en [0, numClasses) . Otros valores generarán una excepción cuando esta operación se ejecute en la CPU y devolverán NaN para las filas de gradiente y pérdida correspondientes en la GPU.
logits Activaciones por etiqueta (normalmente una salida lineal) de forma [d_0, d_1, ..., d_{r-1}, numClasses] y tipo de datos de TFloat16 , TFloat32 o TFloat64 . Estas energías de activación se interpretan como probabilidades logarítmicas no normalizadas.
Devoluciones
  • Un Tensor de la misma forma que labels y del mismo tipo que logits con la pérdida de entropía cruzada softmax.
Lanza
Argumento de excepción ilegal Si los logits son escalares (deben tener rango >= 1) o si el rango de las etiquetas no es igual al rango de los logits menos uno.