Konstruktor Publik
Metode Publik
statis <T memperluas TNomber , U memperluas TNomber > Operan | sparseSoftmaxCrossEntropyWithLogits ( Lingkup cakupan, label Operan <T>, logit Operan <U>) Menghitung entropi silang softmax yang jarang antara logits dan labels . |
Metode Warisan
Konstruktor Publik
publik SparseSoftmaxCrossEntropyWithLogits ()
Metode Publik
Operan statis publik sparseSoftmaxCrossEntropyWithLogits ( Lingkup cakupan, label Operan <T>, logit Operan <U>)
Menghitung entropi silang softmax yang jarang antara logits
dan labels
.
Mengukur kesalahan probabilitas dalam tugas klasifikasi diskrit di mana kelas-kelasnya saling eksklusif (setiap entri berada tepat di satu kelas). Misalnya, setiap gambar CIFAR-10 diberi label dengan satu dan hanya satu label: gambar dapat berupa anjing atau truk, namun tidak keduanya.
CATATAN:
Untuk operasi ini, probabilitas label tertentu dianggap eksklusif. Artinya, kelas lunak tidak diperbolehkan, dan vektor labels
harus menyediakan satu indeks spesifik untuk kelas sebenarnya untuk setiap baris logits
(setiap entri minibatch). Untuk klasifikasi soft softmax dengan distribusi probabilitas untuk setiap entri, ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits)
.
PERINGATAN:
Operasi ini mengharapkan logit yang tidak berskala, karena ia melakukan softmax
pada logits
secara internal untuk efisiensi. Jangan panggil operasi ini dengan keluaran softmax
, karena akan memberikan hasil yang salah.
Kasus penggunaan yang umum adalah memiliki logit berbentuk [batchSize, numClasses]
dan memiliki label bentuk [batchSize]
, tetapi dimensi yang lebih tinggi didukung, dalam hal ini dimensi dim
-th diasumsikan berukuran numClasses
. logits
harus memilikiTFloat16
, TFloat32
, atau TFloat64
, dan labels
harus memiliki dtype TInt32
atau TInt64
.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
label | Tensor berbentuk [d_0, d_1, ..., d_{r-1}] (di mana r adalah peringkat labels dan hasil) dan tipe datanya adalah TInt32 atau TInt64 . Setiap entri dalam labels harus berupa indeks di [0, numClasses) . Nilai-nilai lain akan memunculkan pengecualian ketika operasi ini dijalankan pada CPU, dan mengembalikan NaN untuk baris kerugian dan gradien yang sesuai pada GPU. |
logit | Aktivasi per label (biasanya keluaran linier) berbentuk [d_0, d_1, ..., d_{r-1}, numClasses] dan dataType dari TFloat16 , TFloat32 , atau TFloat64 . Energi aktivasi ini ditafsirkan sebagai probabilitas log yang tidak dinormalisasi. |
Kembali
-
Tensor
dengan bentuk yang sama denganlabels
dan tipe yang sama denganlogits
dengan kerugian entropi silang softmax.
Melempar
Pengecualian Argumen Ilegal | Jika logit adalah skalar (harus memiliki peringkat >= 1) atau jika peringkat label tidak sama dengan peringkat logit dikurangi satu. |
---|