Konstruktorzy publiczni
Metody publiczne
statyczny <T rozszerza TNumber , U rozszerza TNumber > Operand | sparseSoftmaxCrossEntropyWithLogits (zakres zakresu , etykiety argumentów <T>, logity argumentów <U>) Oblicza rzadką entropię krzyżową softmax pomiędzy logits i labels . |
Metody dziedziczone
Konstruktorzy publiczni
public SparseSoftmaxCrossEntropyWithLogits ()
Metody publiczne
public static Operand sparseSoftmaxCrossEntropyWithLogits (zakres zakresu , etykiety argumentów <T>, logity argumentów <U>)
Oblicza rzadką entropię krzyżową softmax pomiędzy logits
i labels
.
Mierzy błąd prawdopodobieństwa w zadaniach klasyfikacji dyskretnej, w których klasy wzajemnie się wykluczają (każdy wpis należy do dokładnie jednej klasy). Na przykład każdy obraz CIFAR-10 jest oznaczony jedną i tylko jedną etykietą: obraz może przedstawiać psa lub ciężarówkę, ale nie jedno i drugie.
NOTATKA:
W przypadku tej operacji prawdopodobieństwo danej etykiety uważa się za wyłączne. Oznacza to, że klasy miękkie nie są dozwolone, a wektor labels
musi zapewniać pojedynczy, specyficzny indeks dla prawdziwej klasy dla każdego wiersza logits
(każdego wpisu minibatch). W przypadku miękkiej klasyfikacji softmax z rozkładem prawdopodobieństwa dla każdego wpisu ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits)
.
OSTRZEŻENIE:
Ta operacja oczekuje nieskalowanych logitów, ponieważ wewnętrznie wykonuje softmax
na logits
w celu zwiększenia wydajności. Nie wywołuj tej operacji z wyjściem softmax
, ponieważ spowoduje to nieprawidłowe wyniki.
Typowym przypadkiem użycia są logity o kształcie [batchSize, numClasses]
i etykiety o kształcie [batchSize]
, ale obsługiwane są wyższe wymiary, w którym to przypadku zakłada się, że wymiar dim
ma rozmiar numClasses
. logits
muszą miećTFloat16
, TFloat32
lub TFloat64
, a labels
muszą mieć dtype TInt32
lub TInt64
.
Parametry
zakres | aktualny zakres |
---|---|
etykiety | Tensor kształtu [d_0, d_1, ..., d_{r-1}] (gdzie r to ranga labels i wynik), a typ danych to TInt32 lub TInt64 . Każdy wpis w labels musi być indeksem w [0, numClasses) . Inne wartości zgłoszą wyjątek, gdy ta operacja zostanie uruchomiona na procesorze i zwrócą NaN dla odpowiednich wierszy strat i gradientów na GPU. |
logity | Aktywacje na etykietę (zwykle wyjście liniowe) kształtu [d_0, d_1, ..., d_{r-1}, numClasses] i dataType TFloat16 , TFloat32 lub TFloat64 . Te energie aktywacji są interpretowane jako nieznormalizowane prawdopodobieństwa logarytmiczne. |
Zwroty
-
Tensor
o tym samym kształcie colabels
i tego samego typu cologits
z utratą entropii krzyżowej typu softmax.
Rzuca
Wyjątek IllegalArgument | Jeśli logity są skalarami (muszą mieć rangę >= 1) lub jeśli ranga etykiet nie jest równa rangi logitów minus jeden. |
---|