Constructores Públicos
Métodos públicos
estático <T extiende TNumber , U extiende TNumber > Operando | sparseSoftmaxCrossEntropyWithLogits (alcance del alcance , etiquetas del operando <T>, logits del operando <U>) Calcula la entropía cruzada dispersa de softmax entre logits y labels . |
Métodos heredados
Constructores Públicos
público SparseSoftmaxCrossEntropyWithLogits ()
Métodos públicos
Operando estático público dispersoSoftmaxCrossEntropyWithLogits (alcance del alcance , etiquetas del operando <T>, logits del operando <U>)
Calcula la entropía cruzada dispersa de softmax entre logits
y labels
.
Mide el error de probabilidad en tareas de clasificación discretas en las que las clases son mutuamente excluyentes (cada entrada pertenece exactamente a una clase). Por ejemplo, cada imagen CIFAR-10 está etiquetada con una y sólo una etiqueta: una imagen puede ser un perro o un camión, pero no ambos.
NOTA:
Para esta operación, la probabilidad de una etiqueta determinada se considera exclusiva. Es decir, no se permiten clases suaves y el vector labels
debe proporcionar un único índice específico para la clase verdadera para cada fila de logits
(cada entrada de minibatch). Para una clasificación softmax suave con una distribución de probabilidad para cada entrada, ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits)
.
ADVERTENCIA:
Esta operación espera logits sin escalar, ya que realiza un softmax
en logits
internamente para mayor eficiencia. No llame a esta operación con la salida de softmax
, ya que producirá resultados incorrectos.
Un caso de uso común es tener logits de forma [batchSize, numClasses]
y tener etiquetas de forma [batchSize]
, pero se admiten dimensiones más altas, en cuyo caso se supone que la dimensión dim
-ésima es de tamaño numClasses
. logits
deben tener elTFloat16
, TFloat32
o TFloat64
, y labels
deben tener el tipo d TInt32
o TInt64
.
Parámetros
alcance | alcance actual |
---|---|
etiquetas | Tensor de forma [d_0, d_1, ..., d_{r-1}] (donde r es el rango de labels y el resultado) y el tipo de datos es TInt32 o TInt64 . Cada entrada en labels debe ser un índice en [0, numClasses) . Otros valores generarán una excepción cuando esta operación se ejecute en la CPU y devolverán NaN para las filas de gradiente y pérdida correspondientes en la GPU. |
logits | Activaciones por etiqueta (normalmente una salida lineal) de forma [d_0, d_1, ..., d_{r-1}, numClasses] y tipo de datos de TFloat16 , TFloat32 o TFloat64 . Estas energías de activación se interpretan como probabilidades logarítmicas no normalizadas. |
Devoluciones
- Un
Tensor
de la misma forma quelabels
y del mismo tipo quelogits
con la pérdida de entropía cruzada softmax.
Lanza
Argumento de excepción ilegal | Si los logits son escalares (deben tener rango >= 1) o si el rango de las etiquetas no es igual al rango de los logits menos uno. |
---|