SparseSoftmaxCrossEntropyWithLogits

kelas publik SparseSoftmaxCrossEntropyWithLogits

Konstruktor Publik

Metode Publik

statis <T memperluas TNomber , U memperluas TNomber > Operan
sparseSoftmaxCrossEntropyWithLogits ( Lingkup cakupan, label Operan <T>, logit Operan <U>)
Menghitung entropi silang softmax yang jarang antara logits dan labels .

Metode Warisan

Konstruktor Publik

publik SparseSoftmaxCrossEntropyWithLogits ()

Metode Publik

Operan statis publik sparseSoftmaxCrossEntropyWithLogits ( Lingkup cakupan, label Operan <T>, logit Operan <U>)

Menghitung entropi silang softmax yang jarang antara logits dan labels .

Mengukur kesalahan probabilitas dalam tugas klasifikasi diskrit di mana kelas-kelasnya saling eksklusif (setiap entri berada tepat di satu kelas). Misalnya, setiap gambar CIFAR-10 diberi label dengan satu dan hanya satu label: gambar dapat berupa anjing atau truk, namun tidak keduanya.

CATATAN:

Untuk operasi ini, probabilitas label tertentu dianggap eksklusif. Artinya, kelas lunak tidak diperbolehkan, dan vektor labels harus menyediakan satu indeks spesifik untuk kelas sebenarnya untuk setiap baris logits (setiap entri minibatch). Untuk klasifikasi soft softmax dengan distribusi probabilitas untuk setiap entri, ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits) .

PERINGATAN:

Operasi ini mengharapkan logit yang tidak berskala, karena ia melakukan softmax pada logits secara internal untuk efisiensi. Jangan panggil operasi ini dengan keluaran softmax , karena akan memberikan hasil yang salah.

Kasus penggunaan yang umum adalah memiliki logit berbentuk [batchSize, numClasses] dan memiliki label bentuk [batchSize] , tetapi dimensi yang lebih tinggi didukung, dalam hal ini dimensi dim -th diasumsikan berukuran numClasses . logits harus memiliki tipe data dari TFloat16 , TFloat32 , atau TFloat64 , dan labels harus memiliki dtype TInt32 atau TInt64 .

Parameter
cakupan ruang lingkup saat ini
label Tensor berbentuk [d_0, d_1, ..., d_{r-1}] (di mana r adalah peringkat labels dan hasil) dan tipe datanya adalah TInt32 atau TInt64 . Setiap entri dalam labels harus berupa indeks di [0, numClasses) . Nilai-nilai lain akan memunculkan pengecualian ketika operasi ini dijalankan pada CPU, dan mengembalikan NaN untuk baris kerugian dan gradien yang sesuai pada GPU.
logit Aktivasi per label (biasanya keluaran linier) berbentuk [d_0, d_1, ..., d_{r-1}, numClasses] dan dataType dari TFloat16 , TFloat32 , atau TFloat64 . Energi aktivasi ini ditafsirkan sebagai probabilitas log yang tidak dinormalisasi.
Kembali
  • Tensor dengan bentuk yang sama dengan labels dan tipe yang sama dengan logits dengan kerugian entropi silang softmax.
Melempar
Pengecualian Argumen Ilegal Jika logit adalah skalar (harus memiliki peringkat >= 1) atau jika peringkat label tidak sama dengan peringkat logit dikurangi satu.